分割聚类(Diarization)是指根据“谁说了什么”将多人语言样本分割成相应的碎片段,再对所有碎片段进行聚类,把属于同一个说话人的片段都聚在一起,标注出这些碎片段属于谁。对于机器来说整个处理过程并不能像人类那样得心应手,而且机器学习算法的培训也要比想象中的更难。一个强大的分割聚类系统还要识别出此前并未关联的新语音碎片段。

不过朝着高性能模式发展的道路上,谷歌的人工智能研究部门已经取得了令人鼓舞的突破性进展。在最新发表的论文“Fully Supervised Speaker Diarization”[PDF]以及官方博文中,谷歌研究人员描述了一种全新的人工智能系统,能够让系统以更又有效的方式来使用声音样本标签。

这篇论文的核心算法在 NIST SRE 2000 CALLHOME的跑分中,能够在实时语音聊天应用中将在线分割聚类错误率(EDR)降低至7.6%。而谷歌此前在GitHub上开源的方式EDR为8.8%。谷歌研究人员的新方法就是通过递归神经网络(RNN)模拟说话者的输入(例如用数字方法表示说话者的单词和短语),这种机器学习模型类型能够使用内部状态来处理输入序列。

Coding

活动入口:

Coding敏捷研发 - 研发产出提升20% 5人以下小团队免费

走进Verisign - 互联网根服务器的管理者/.com的守护者

责任编辑:study875

对文章打分

[图]谷歌AI新突破:实时聊天中识别“谁说了什么”正确率高达92%

2 (10%)
已有 条意见

    最新资讯

    加载中...

    今日最热

    加载中...

    新品速递

    热门评论

      相关文章

      Top 10

      招聘


      Advertisment ad adsense googles cpro.baidu.com
      created by ceallan
    • 端午小长假 我省北中部有雨 2019-05-18
    • 湖南《当代商报》工作人员戴石宗在家中遇害,嫌犯已落网 2019-05-14
    • 吕岛的专栏作者中国国家地理网 2019-05-07
    • 无视婚变传闻 王浩信晒与朋友新旧对比照秀友情 2019-05-07
    • 少女与妈妈每年自拍两次 最后一次让十几万人哭了 2019-04-25
    • [微笑]然后所有的诊疗活动全免费……小萌们以为如何? 2019-04-25
    • 行业变革中的房产经纪公司加盟暗战 ——凤凰网房产深圳 2019-04-20
    • 校外培训机构专项整治 对无证无照超纲超前说“不” 2019-04-15
    • 靠VAR和智能芯片建功 法国天团世界杯首战胜之不武? 2019-03-28
    • 孟非:父母在相亲中的开放 超乎想象 2019-03-28
    • 网售私房粽游走法律边缘 打养生旗号难以说清依据 2019-03-16
    • 2017年第96届全国糖酒会在成都圆满落幕 2019-03-16
    • 新时代谱写清徐转型发展新篇章 2019-03-07
    • 港姐自曝曾在加拿大遇车祸昏迷 爸爸吓到不敢去探望 2019-03-07
    • 探访广西高考评卷现场:评卷场所警戒线“包围” 2019-02-27