科学网

 找回密码
  注册
第七届人工智能城市挑战赛(AI CITY CHALLENGE)获得冠军
石自强 2023-7-24 10:40
近日,在第七届人工智能城市挑战赛(AI CITY CHALLENGE 2023)中,我们第一次参赛,参与的是第四赛道:“用于自动零售结账的多类别产品计数和识别”(Multi-Class Product Counting Recognition for Automated Retail Checkout)。该项任务有数十支队伍参赛,包括 北京邮电大学、成均馆大学 ( SKKU)、多伦多大学 ...
个人分类: 软件发布|667 次阅读|没有评论
新一代高保真声码器ItoWave (已被ICASSP 2022录用)
石自强 2022-2-23 14:42
声码器是语音合成的主要组件。 它将音频的中间形式(称为声学特征,例如梅尔频谱)转换为可听的声音波形。 最近 Shoule Wu 和我合作发明了一种新一代的高保真声码器 ItoWave 。 ItoWave 基于伊藤随机微分方程开发。我们提出通过线性 Ito 随机微分方程,在条件输入下, 如原始声音特征(例如语音 ...
个人分类: 科研DEMO|1411 次阅读|没有评论
男女性别识别软件 AnnaGender v1.0
石自强 2021-12-6 09:34
我们开发了一款基于声音的性别自动识别软件AnnaGender v1.0。该软件的作用是仅仅通过一段5秒-15秒之间的语音,就能识别出说这段语音的人的性别(也就是通过语音识别男女)。该软件在内部测试集合上达到98.57%的性能,在第三方某金融机构的1000条电话测试集上达到91.8%的性能,基本满足实际使用要求。 ...
个人分类: 软件发布|3679 次阅读|没有评论
TasTas在Interspeech2020国际学术会议发表
热度 1 石自强 2020-10-29 11:34
2020年10月25日-29日参加了在中国上海举行的国际语音通讯联合会年度会议(Annual Conference of The International Speech Communication Association, Interspeech2020)。Interspeech是语音处理领域最权威的国际会议,每年召开一次。世界各国著名高校、研究机构及相关知名企业等均参会。我们的论文题为“Speech Separati ...
个人分类: 科研DEMO|2940 次阅读|2 个评论 热度 1
赠书《声学事件检测理论与方法》
石自强 2019-7-30 10:58
走过路过,不要错过。由于出版社有一些压箱底的样书(其实是实在卖不出去了O(∩_∩)O),免费寄回给我们。我们将这些书免费(邮费还是要付下滴)回赠给对该领域的广大读者。请对本书感兴趣以及需要该书的读者联系我们(shiziqiang7@gmail.com),留下你们的快递地址、工作单位、联系电话,先到先得,数量有限,赠完为止, ...
个人分类: 软件发布|2616 次阅读|没有评论
第五届声学场景和事件的检测和分类竞赛(DCASE 2019)获得季军
石自强 2019-7-1 10:11
近日,在第五届声学场景和事件的检测和分类竞赛(Detection and Classification of Acoustic Scenes and Events 2019, DCASE 2019)中,我们第一次参赛,参与的任务是task4:“家庭环境中的声音事件检测”。该项任务有19支队伍参赛,52个有效提交结果,参赛的队伍包括中科院、中国科技大学、国防科大、法国Orange Labs、 ...
个人分类: 软件发布|8661 次阅读|没有评论
2篇论文被Interspeech2019录用
石自强 2019-6-25 09:10
近日研究组撰写的2篇论文被Interspeech 2018录用,届时将去赴会宣读论文。本次会议将于今年9月15-19日在奥地利格拉茨召开。Interspeech是语音处理领域两大权威的国际会议之一,每年召开一次。本次录用的工作是关于语音分离的,我们在公开数据集WSJ0-2mix取得了最好的性能,目前达到18.4dB的SDRi。更详细的信息可以查看 htt ...
4441 次阅读|没有评论
参加ICASSP2019国际学术会议
石自强 2019-5-18 03:17
2019年5月13日-18日参加了在英国布莱顿举行的国际声学、语音与信号处理大会(The 41th International Conference on Acoustics, Speech, and Signal Processing,ICASSP2016)。ICASSP是语音处理领域最权威的国际会议,每年召开一次。世界各国著名高校、研究机构及相关知名企业等均参会。我们的论文题为“FurcaX: End-to-en ...
个人分类: 学术会议|4207 次阅读|没有评论
Learning-to-learn项目总结
石自强 2019-5-2 23:20
过去的一年,我主要领导和参与了两个项目,分别是语音分离和learning-to-learn。其中语音分离还是原来的老本行声音技术下面的一个小领域,在其他博文已经做了介绍。本篇文章的目的主要是总结一下learning-to-learn项目的经验,以便吃一堑长一智。 &nb ...
个人分类: 科研DEMO|3306 次阅读|没有评论
语音声音分离软件FurcaNeXt v1.0
热度 1 石自强 2019-4-17 17:29
多说话人单麦克风语音分离 的目的是将目标语音与背景干扰分开。 在信号处理中,语音分离是一种非常基本的任务类型,具有广泛的应用,包括听觉增强,移动通信,高精度的自动语音和说话人识别 。例如,在多人说话的家庭环境或会议环境中,人类听觉系统可以非常容易地从多个说话人的混合语音中跟踪目标说话人的 ...
4645 次阅读|1 个评论 热度 1

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 18:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部