huanglanqi711的个人博客分享 http://blog.sciencenet.cn/u/huanglanqi711

博文

关于科技信息事件抽取建模的理解

已有 1040 次阅读 2023-3-3 21:47 |个人分类:学习笔记|系统分类:科研笔记

两周前,导师给我讲,科技信息事件的提取建模这个方向很有意思,让我琢磨一下,我看了好几篇论文,现在梳理一下思路:

1. 针对哪些文本信息进行科技事件抽取?

初步构想:针对社交媒体平台上的科技信息进行事件抽取,这种非结构化的信息需要考虑从哪个平台中获取最方便,信息最多,我接触过的平台有:小木虫、科学网、Kaggle、谷歌学术等,现在要考虑从中文社区获取信息还是英文社区,我英语不太行但是英语的或许好抽取事件,能有现成模型可以用

问题拆解:选择社交平台,进行内容爬取

2. 选择哪种NLP模型来提取事件呢?

这部分没想好,因为还没有相关数据和分析的内容

3.将科技事件从社交媒体信息中提取出来,要干什么呢?

猜想:

1)梳理科技发展脉络

2)科技事件舆情分析




https://blog.sciencenet.cn/blog-3549363-1378803.html

上一篇:信息资源管理笔记(一)
下一篇:日常笔记(三)
收藏 IP: 124.205.16.*| 热度|

1 许培扬

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 19:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部