wshuyi的个人博客分享 http://blog.sciencenet.cn/u/wshuyi

博文

按标题搜索
你的机器“不肯”学习,怎么办?
热度 1 2019-5-1 08:30
给你讲讲机器学习数据预处理中,归一化(normalization)的重要性。 前情回顾 Previously, on 玉树芝兰 …… 我给你写了一篇《 如何用 Python 和 Tensorflow 2.0 神经网络分类表格数据? 》,为你讲解了 Tensorflow 2.0 处理结构化数据的分类。 结尾处,我给你 留了一个问题 。 把测试集输入模型中,检验效果。 ...
8306 次阅读|1 个评论 热度 1
文科生 Python 与数据科学入门教材推荐
2019-4-22 10:50
从入门到精通,给你推荐几本 Python 与数据科学好书。 需求 最近读者数量增长了不少。有许多新读者留言,说自己想入门 Python 与数据科学,希望我能够推荐一些教材书籍。 老读者们都知道,我经常会在教程末尾的“资源”或者“小结”章节,推荐相关的书目。我推荐的书籍,有个特点,就是写得简明易懂,适合文科生阅 ...
9745 次阅读|没有评论
如何用 Python 和 Tensorflow 2.0 神经网络分类表格数据?
热度 1 2019-4-15 11:51
以客户流失数据为例,看 Tensorflow 2.0 版本如何帮助我们快速构建表格(结构化)数据的神经网络分类模型。 变化 表格数据,你应该并不陌生。毕竟, Excel 这东西在咱们平时的工作和学习中,还是挺常见的。 在之前的教程里,我为你分享过, 如何利用深度神经网络,锁定即将流失的客户 。里面用到的,就是这样的表 ...
6970 次阅读|1 个评论 热度 1
如何用 Python 和 BERT 做中文文本二元分类?
2019-4-8 08:59
兴奋 去年, Google 的 BERT 模型一发布出来,我就很兴奋。 因为我当时正在用 fast.ai 的 ULMfit 做自然语言分类任务(还专门写了《 如何用 Python 和深度迁移学习做文本分类? 》一文分享给你)。ULMfit 和 BERT 都属于预训练语言模型(Pre-trained Language Modeling),具有很多的相似性。 所谓语言模型,就是利 ...
6678 次阅读|没有评论
如何将 PDF 表格数据免费转换到 Excel ?
2019-4-1 08:50
所见即所获,提升你的数据采集效率。 需求 写了那篇《 如何用Python批量提取PDF文本内容? 》后,我在后台收到了许多留言。 不少读者询问,如果是 PDF 文件中的表格呢?能否正确转换? 我当时没有理解这种需求。因为那篇文章谈的主要是把文本抽取出来,目的主要是进行下一步的自然语言处理。这种 PDF 文件中大量的 ...
4902 次阅读|没有评论
如何用 R 绘制交互式社会网络图?
热度 1 2019-3-25 10:55
挖掘社会关系网络,助你洞若观火。 需求 最近有个学生问我,如何绘制 交互式 社会网络图(Interactive Social Network Graph)? 之所以一定要交互式,是因为他的应用场景,是演示给客户。 他解释说,如果客户有选项,可以根据需要来缩放图形、聚焦类别,甚至是可以拖拽图形元素,以不同视角来查看,那展示效果显 ...
10219 次阅读|1 个评论 热度 1
如何用虚拟现实培训领导力?
2019-3-22 08:23
盛会 2019年3月18日-20日,第四届中美智慧教育大会(US-China Smart Education Conference)在北得克萨斯大学(University of North Texas, UNT)举行。 我恰好正在 UNT 访学,近水楼台,欣然付费参加。因为这学期我作为 adjunct faculty 授课,还有个员工优惠码可用。但为了要优惠,单位只能填 UNT 。所以在一次中 ...
3647 次阅读|没有评论
如何用 Python 和 Pandas 分析犯罪记录开放数据?
2019-3-6 11:38
从开放数据中,你可以了解一个城市或者社区是否安全,并合理避险。 开放 3月2日,应主办方 TechMill 的邀请,我参加了在达拉斯公共图书馆举行的“达拉斯-沃斯堡开放数据日”(DFW Open Data Day)。 为了鼓励我 INFO 5731 课程的学生们积极参加这项活动,我还制定了加分政策。 不过因为加分策略偏于保守,来的 ...
2992 次阅读|没有评论
如何用 Google Colab 练 Python?
热度 5 2019-2-19 11:41
自动配置、有效求助、协作编程、版本控制。一站式解决 Python 新手练习中的痛点。 痛点 这个学期,我在北得克萨斯大学(University of North Texas)教 INFO 5731: Computational Methods for Information Systems 课程,主要内容包括: Python 基础、自然语言处理,以及机器学习。 授课的对象是信息科学、数据科 ...
10681 次阅读|5 个评论 热度 5
坐自动驾驶汽车,是怎样的一种体验?
2019-2-4 12:06
管中窥豹,遇见未来。 好不容易放个假,好好歇歇。所以咱们这次,就不给大家讲 Python 编程了。 但是咱们要谈的话题,依然是和数据科学有关。那就是——自动驾驶。 我上课的时候,没少给学生播放 Tesla 那段脍炙人口的自动驾驶视频。学生们都觉得很惊艳。 但是,看视频,和自己坐在这样的车上,还是有些区别 ...
3303 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 11:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部