《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

非常折服苹果的技术转化能力,但就自然语言技术本身来说 ...

已有 6279 次阅读 2011-10-8 08:10 |个人分类:立委科普|系统分类:科研笔记| NLP, 苹果, 自然语言处理, siri, NLU

苹果 iPhone 4S 里面的 Siri,跟我们的工作没法比

它面对的是非常狭窄的语言子集,我面对的是全开放的语言现象。

自然语言处理,领域越单纯,应用越好 。可我没有这个便利,我面对的是跨领域。

自然语言处理,语言越规范(譬如正式新闻),应用越好。可我没有这个便利,我面对的是社会网络的用语:充满了错别字、不合语法的说法,还有稀奇古怪的表达(譬如emoticons)。

自然语言处理,抽取事实的应用比较成熟,而抽取主观评价和情绪性话语比较难,而且现象很模糊。可我没有这个便利,我面对的是 sentiment extraction。

自然语言处理,单纯任务比较好办,譬如好话坏话的两级分类,复杂任务比较难,譬如要抽取好话坏话里面的细节和动机。可我没有这个便利,我们的产品需要这些细节和动机,来挖掘 actionable insights。

最后,自然语言处理,做研究的不少是玩具系统,做得大的大多也只在几个 GB 的量上做文章 。可我没有这个便利,我面对的是大数据 (big data),至少在 billion 文章的量级上。多了,真地就不一样了,从精雕细刻每棵语句之树,转为对语言之林的鸟瞰,与登泰山的感受类似,一览众林小。

总之,从各个方面看,我都是选择了最难的一条路,没走捷径。是在钢板最厚的地方钻眼。严格地说,不是我的选择,是机遇迫使我做这样的选择。

结果呢?曾经沧海。

没有什么可怕了。产品的技术门槛高了,具有竞争优势,开发起来带劲儿。难题经过多了,人也鲁棒、踏实了。未来呢,天生我才必有用,牛刀宰鸡快如麻。



https://blog.sciencenet.cn/blog-362400-494352.html

上一篇:why hybrid? on machine learning vs. hand-coded rules in NLP
下一篇:需要有“混血”,尤其是从产业界回到学校的血统
收藏 IP: 192.168.0.*| 热度|

2 张婷婷 吕喆

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 12:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部