wengewsh的个人博客分享 http://blog.sciencenet.cn/u/wengewsh

博文

网页数据采集方法及其应用

已有 2643 次阅读 2019-6-28 12:26 |个人分类:研究生课程论文|系统分类:人文社科


IMG_6247.JPG

        2019.03-2019.06曲阜师范大学统计学院王文武博士主持讨论《基于R语言的自动数据收集---Web数据抓取和文本挖掘》(Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining)。参加讨论的硕士研究生有16名,他们分别是:曹智苗、杜浩哲、冯园园、付悦、姜鑫、韩婷婷、何珊珊、贺真、黄晨玮、王敬、闫文、杨静、赵文慧、支席年、周潇、周璇。

    本课程的核心内容是自动化数据抓取和文本挖掘的方法。在大数据时代,这些技术为各专业领域的研究者提供了强大的工具,使得任何人都可以像自然科学家一样通过建模、采集数据和统计分析得到定量的结果,从而支持他们的结论。

    基于本课程的学习和个人研究兴趣,分组完成大课题研究。具体研究课题如下:

1.  冯园园、付悦---基于豆瓣影评的文本分析

冯园园、付悦---基于豆瓣影评的文本分析.pdf

2.  韩婷婷、何珊珊---关于手机评论的情绪分析

韩婷婷、何珊珊---关于手机评论的情绪分析.pdf

3.  贺真、黄晨玮---对NBA赛事的数据挖掘及分析

贺真、黄晨玮---对NBA赛事的数据挖掘及分析.pdf

4.  王敬、姜鑫---关于中国政府信息公开的文本分析

王敬、姜鑫---关于中国政府信息公开的文本分析.pdf

5.  杨静、闫文、赵文慧---香水销售数据采集与情感分析

杨静、闫文、赵文慧---香水销售数据采集与情感分析.pdf

6.  支席年、曹智苗---基于R语言的地图绘制探索

支席年、曹智苗---基于R语言的地图绘制探索.pdf

7.  周潇、杜浩哲、周璇---基于文本信息挖掘的两会政府工作报告分析

home.php?mod=attachment&filename=&id=393517


     这些研究成果仅用于学习交流,版权属于讨论小组成员所有。

对任何侵权行为,必究法律责任。

 




https://blog.sciencenet.cn/blog-3316039-1187198.html

上一篇:Robust Estimation of Derivatives Using LowLAD
下一篇:基于豆瓣影评的文本分析---以《流浪地球》为例
收藏 IP: 117.132.52.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 00:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部