相关新闻
-
深度好文解析网站设计的精髓
2026-04-30 22:36简洁已经是北京网站制作追求的主流设计方式之一了,简约的网站制作更容易受到用户的青睐,融入优质的用户体验加上操作预览便捷的设计,让北京网站制作变得更加简单化。北京网站设计公海555000JC线路检测中心就跟大家说几
-
“疫情”下的互联网买菜,订单激增5倍!
2026-04-23 14:39这个特殊的春节,在家中隔离的居民们,已经把重心从口罩放到了抢菜这件事上。传统菜市场成了大家避之不及的场所,互联网网站开发线上买菜则成了突破口。无论是盒马鲜生、叮咚买菜、苏宁菜场还是每日优鲜,
-
北京企业网站建设哪家好 网站建设为企业带来什么
2026-04-21 09:06随着互联网时代的发展,传统企业已向互联网行业寻求突破,想要得到更好的发展与认可,以及得到更好的宣传,最好的方式是建设企业网站。北京网站制作公海555000JC线路检测中心科技有限公司具有多年企业建站经验。所产出
-
“互联网教育”市场趋势已呈“下沉”势态
2026-04-15 11:18蓝鲸教育5月20日讯,今日沪江宣布整体累计用户突破2亿,覆盖包括大学生、中小幼、白领等学习人群。数据显示,其用户覆盖全国34个省市自治区和直辖市,有超过一半用户分部在上海、天津、深圳、杭州、
-
企业在网站开发中如何做到“万事俱备”?
2026-04-12 14:55互联网网站开发时代网站的数量逐步猛增,这也导致了很多网站设计都大同小异,让用户感觉网站都是千篇一律的,没有新鲜感,很容易就会感到审美疲劳。在进行北京网站开发设计时制作出一个独具特色的网站是众
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。
020-12553596
现在就想找顾问聊聊立即咨询