在近日举行的2025世界人工智能大会(简称WAIC 2025)人工智能终端产业发展论坛,科大讯飞副总裁赵翔出席论坛并发表主题演讲,围绕“以大模型赋能智能终端”展开深度分享。
在翻译场景,科大讯飞最新发布的语音同传大模型具备90分级别的准确率与仅2秒的延迟,结合边译边说、语音听感拟人播报、8万+垂直领域专业词汇,支持着讯飞同传、讯飞双屏翻译机2.0等系列软硬件产品更好地服务于各类国际会议、展会、跨境洽谈等高要求场合。
在办公场景,讯飞智能办公本与AI录音笔融合离线大模型,实现中英转写、发言人识别、会议纪要自动生成,适配无网、远距、高保密等复杂需求,为专业场合提供“随时可用”的智能能力。
他表示,随着AI能力不断下沉终端,2025年有望成为“全民AI”与“全行业AI”的关键元年,AI正在像水和电一样服务每一个场景;而智能终端也正在成为推动中国企业“走出去”的新型数字工具。
【对话】
让用户离不开的产品才有生命力
南方+:大模型在终端产品的应用上似乎雷声大雨点小,大模型应用的突破口在哪里?
赵翔:智能硬件终端产品可以分为三类。第一类是大家比较熟悉的基础设备,比如PC和手机,也在进行智能化。第二类是可穿戴设备,目前最热门的可穿戴设备是智能眼镜,也包括耳机、智能手环等。第三类是一些是新形态,如家庭机器人、外骨骼机器人和具身智能机器人。可以将其分为三大类:基础设备、可穿戴设备和创新形态设备。
这些智能硬件最核心的问题,是否基于技术,实现软硬件结合?哪些产品是消费者不需要的?这类客群的特点是什么?对于很多产品,用户是否发自内心喜爱它,并且离不开它,只有这样,产品才具有生命力和持续发展。
比如,我们计划进入韩国市场的智能办公本,硬件产品本身与在中国销售的相同,同时基于大语言模型上线了韩语版本。其次,改进韩国用户在软件层面的交互变化。
南方+:最近消费电子产品市场也比较“卷”,打价格战的现象不是发生。如何破解这样的问题?
赵翔:首先需要提高技术应用成效。技术并非挂在实验室里的空话,而是真正为用户带来体验。
以我们的翻译为例,这次发布的端到端同传大模型的升级,为用户带来的是真正好用,而非仅仅拼价格,其语音翻译效果比1月份版本有了20%的提升。
比如,翻译语句的完整性、翻译的准确性和语言质量这几个指标上,是与中国翻译协会合作的结果。同传也有标准定义,我们与上海外国语大学高级翻译学院联合合作。我们与产学研联动,定义真同传、好同传。
其次速度要加快。我们需要达到真人同传以及翻译员的速度,因此在中英翻译中,从开口说话到机器翻译开始播报,中间接延迟仅为两秒。如果你们需要加快速度,还可以立即开始翻译。
第三点是翻译结果的播报,不能有机器播报声音,而是根据自然语言理解。这些需要根据翻译结果理解他在讲什么。根据你对文字的理解,使得机器如同真人一样。我们通过对语言本身机器的理解,了解哪些地方应该停顿、延续、铿锵有力以及如何可以婉转,通过调节语速和语气,实现整个播报过程更像真人在讲话。
第四点是行业翻译。正常且简单的轻翻译沟通,可以解决用户的一部分问题。但实际上,很多用户是商务人士,有些政府官员在商务谈判中表现得相对严谨,对行业术语翻译的严谨性要求较高。
南方+:实现软硬件一体化,你们为此做了哪些工作?
赵翔:以翻译机为例,在硬件提升方面,由于具备端侧大模型能力,在无网络情况下,翻译水平需要达到与有网络相匹配。
再比如,降噪能力,很多用户都是外贸人群,他们会在展会上、工厂车间拿着翻译机使用,使用手机就会发现噪音非常大。翻译机能做到一米距离以外的声音被隔绝,机器的声音、机场播音员上空的声音、展会其他人嘈杂的声音,在一米之外的也能隔离。只有深入理解场景才能够更好地掌握用户需求。
南方+:刚才谈到出海,目前出海情况如何,采取了哪些本地化措施?
赵翔:我举个例子,在用户调研时,我结识了一位浙江做饮水机的老板,一年销售额达到2亿元,主打商用饮水机,比如法国的戴高乐机场,阿联酋的迪拜国际机场,美国洛杉矶和纽约的机场等等都有他的产品。他没有读过大学,英文能力不足,无法开口讲话或者表现不够好,他会使用讯飞的翻译机,带着讯飞的翻译机一起走天下。
智能录音笔在日本的销售情况也非常不错。日本有一家专门从事办公品类的销售公司主动找到我们,原因是发现科大讯飞的翻译机在他的平台上已经排名第一,超过了日本索尼等传统品牌。他专门找我们解释原因:日本人对用户隐私特别关注,科大讯飞为日本提供了一款完全离线的产品。以前市面上并没有这样的产品。
南方+记者 郜小平
证券配资公司提示:文章来自网络,不代表本站观点。