本年以来,我国人工智能大模型等为代表的数字技能快速地开展,国产AI逐渐赋能千行百业,让人有了切切实实的感触。
前不久,在上海举行的2025国际人工智能大会上,2024年诺贝尔物理学奖获得者杰弗里·辛顿宣布题为《数字智能是否会替代生物智能》的讲演,提出自己对人工智能开展的主张。讲演完毕后,我国外交部原副部长傅莹和辛顿偶遇,发生了一段耐人寻味的对话。
傅莹说:“杰弗里,今日你的讲演我听得很清楚,屏幕上有实时中文翻译字幕,AI一直在翻译你的话。”
这项“听懂”辛顿的AI技能,来源于我国企业科大讯飞。辛顿以英文方式讲演,专业词汇多、了解难度大,AI怎么将中英同传首字呼应压缩到2秒以内,达到了人类顶尖同传舌人的反应速度?这背面触及底层技能的攻关。
“传统形式下,机器翻译要阅历‘源语音—源文字—翻译—方针文字—方针语音’五段跳,因而功率低、延时长。”科大讯飞副总裁、安徽听见科技有限公司总经理王玮介绍,“不少人可能有这样的体会,用手机app语音翻译时,先在屏幕上辨认出中文,再花时间翻译成外语。而现在,咱们的技能能完成源语音到方针语音的端到端翻译。”
当时,我国已发布超1500个大模型,在全球已发布的大模型中数量位居首位。从“边听边说”到“语音同传”,背面离不开讯飞星火语音同传大模型的支撑。
更进一步,有没有可能让机器从单项言语的辨认翻译,到多项言语混合的辨认和翻译?
本年7月,香港立法会正式推出与科大讯飞联合打造的才智抄写体系“智识听”AI实时字幕功用。大众可以终究靠立法会网站的网上播送等渠道收看带有实时字幕的立法会大会会议直播。该功用遭到香港特区立法会主席梁君彦的线上“点赞”。
“‘智识听’建造历时近三年,其间,遇到最扎手的技能问题是怎么样进步三语混读引擎辨认率。”王玮介绍说,会议中或许会呈现普通话、粤语、英语三种言语,英语辨认率下降到85%左右,一定要运用三语混读引擎。
怎么处理?一种原因是引擎晋级,从CPU版别换成了GPU版别;另一方面,香港立法会供给了包括2.5亿汉字的中英文对照和20万个高频粤语词汇,助力机器学习,提高文本翻译的作用。
现在“智识听”实时字幕的准确率达96%,经过人工即时修正后准确率可达99%。会议的逐字记载功率也因而项技能的落地大幅提高。
“未来,咱们将不断强化多语种支撑才能,将逐渐掩盖‘一带一路’共建国家重点语种字幕生成,助力香港衔接国际舞台。”王玮说。 (本报记者赵昊)
上一篇:智能仪表物联网