Facebook机器学习系统能实时审查海量图片中的多国文字

后文本时代,网络用户越来越多地使用图像和视频交流,这为大型互联网平台的内容检索内容推荐和内容审核带来巨大麻烦。对于像Facebook这样每月活跃用户超过20亿的平台,每天用户都会发布海量图片。为了提高照片检索的正确率,同时确保以确保图片中不包含仇恨言论和违反网站内容的政策的内容,Facebook已经创建和部署了一个名为“Rosetta”的大型机器学习图像识别系统。

Facebook需要一个可以定期处理大量内容的光学字符识别系统(OCR),这也是Facebook“Rosetta”项目的初衷。如今Rosetta每天可以实时从多种语言中提取超过十亿个图像和视频帧的文本。

在一篇新的博客文章中,Facebook介绍了Rosetta的工作原理(上图):Rosetta首先检测可能包含文本的图像中的矩形区域。然后使用卷积神经网络来识别和转录在该区域中写的内容,甚至是非英语单词或非拉丁字母的语言,例如阿拉伯语和印地语。为了训练这个系统,Facebook使用了人机和机器注释的公共图像。

Facebook和Instagram的各路团队已经在使用Rosetta来展示推荐和监管海量内容。Facebook还计划继续增加Rosetta可以识别的语言种类,并加强从视频帧中提取文本的功能。

最近,Facebook增加了24种新语言的自动翻译服务,包括塞尔维亚,白俄罗斯,马拉地语,僧伽罗语,泰卢固语,尼泊尔语,卡纳达语,乌尔都语,旁遮普语,柬埔寨语,普什图语,蒙,祖鲁,科萨和索马里。Facebook坦承这些语言的翻译尚处于早期阶段,因此仍然会有较多错漏。

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   
除非注明,本站文章均为原创或编译,转载请务必注明出处并保留原文链接: 文章来自IT经理网
相关文章:


关于作者

写评论

忘记密码

X