由买买提看人间百态
登录
首页
论坛
未名存档
话题女王
小圈子
马甲追踪
版面排名
流量曲线
水枪排名
发帖量曲线
发帖版面饼图
发帖时间柱图
关于本站
帮助
boards
本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字
访问原贴
Headline版
- Google 搜寻能力进化 数秒辨识800种疫苗用语
进入Headline版参与讨论
1
(共1页)
o***s
发帖数: 42149
1
Google推出语言模型新工具MUM,可在几秒钟内辨识出800种以上、超过50种语言用来称呼疫苗的词语。
Google推出语言模型新工具MUM,可在几秒钟内辨识出800种以上、超过50种语言用来称呼疫苗的词语,帮助使用者在Google搜寻中找到COVID-19(2019冠状病毒疾病)疫苗的可靠资讯。
Google搜寻研究员暨副总裁纳雅克(Pandu Nayak)在官方部落格发文说,根据Google的分析,AstraZeneca、CoronaVac、Moderna、Pfizer、Sputnik 等广泛使用的疫苗,在全世界共有超过800种名称。使用者搜寻疫苗资讯时,可能会使用Coronavaccin Pfizer、mRNA-1273、CoVaccine等各式各样的关键字。
纳雅克强调,Google是否能正确识别所有疫苗名称,对于使用者能否获得可靠的最新疫苗资讯至关重要。然而,想辨识出全球使用者对于疫苗的不同称呼,就得付出大量的时间成本,以人工而言需要几百小时。
现在有了MUM(Multitask Unified Model),Google可以在短短几秒钟内辨识出800种以上、超过50种语言用来称呼疫苗的词语。纳雅克表示,在验证MUM的搜寻结果后,Google已能将这个模型应用在Google搜寻服务中,帮助使用者找到全世界有关COVID-19疫苗的资讯。
MUM之所以能在几秒内完成一项原本需要数周时间的工作,是因为具有知识转移能力。纳雅克说,MUM能够从本身接受训练的超过75种语言中学习并转移知识。以阅读一本书为例,如果一个人会多种语言,就可以在阅读后用自己会的其他语言来分享书中重点,MUM对于不同语言知识的转移也很类似这样的概念。
纳雅克指出,这种跨语言迁移学习能力,可以帮助Google快速扩展系统改善,这在一定程度上要归功于MUM的样本效率;相较于之前的模型,MUM在完成同一件工作时需要的资料量大幅减少。以疫苗名称来说,只需要一小部分官方疫苗名称作为样本,MUM就能快速识别这是疫苗在不同语言间的名称。
Google期待MUM在未来可以透过多种方式,让Google搜寻变得更实用。纳雅克说,Google早期的测试结果显示,MUM不仅可以在许多面向上改进Google现有的系统,还可以帮助打造全新的方式来探索和搜寻资讯。
1
(共1页)
进入Headline版参与讨论
未名新帖统计
// 7月16日
#
版面
帖数(主题数)
-
全站
4871 (796)
1
Military
3777 (569)
2
Stock
341 (51)
3
Joke
117 (17)
4
History
116 (3)
5
Automobile
100 (9)
6
USANews
55 (9)
7
Midlife
45 (1)
8
Headline
41 (41)
9
Dreamer
33 (13)
10
FleaMarket
32 (20)
11
Living
30 (7)
* 这里只显示发帖超过25的版面,努力灌水吧:-)
历史上的今天
faintcat妹妹看进来~~
发表于12年前.
NSC, PD 1/7/2007, EB2, ...
发表于11年前.
[FBA求购]MJVE2 758 MJVM2 ...
发表于6年前.
老生常谈,归与不归
发表于10年前.
【申请】Seattle西雅图 版版主——申请人...
发表于9年前.
宝宝出生,头骨骨折,求祝福
发表于9年前.
求推荐舒缓优美的古典音乐
发表于11年前.
百分之一的北京人上北大 中国网友愤怒(转载)
发表于10年前.
新人带狗狗Bailey来报道
发表于12年前.
全世界最有价值的运动队
发表于10年前.
请问大切诺基的质量如何
发表于6年前.
TNND,军版全是BKC
发表于15年前.
Inception
发表于12年前.
微软的有些家属可真恶心,为了卖保险脸都不要了
发表于10年前.
每周坐高铁的苦逼来说说感受吧!!
发表于9年前.