7月28日,“三芯起 万物声”启英泰伦第三代语音芯片发布会如约而至。历经三年潜心研发,启英泰伦正式推出全新第三代智能语音芯片,相较上一代产品,这款芯片身兼算力更高、高度集成和算法新高的“三高”记录,全面覆盖高性能、低成本端侧语音和端云融合语音等应用。
在智能语音识别发展早期,由于语音识别对算力的要求高,企业都是通过云端进行智能语音识别处理。启英泰伦却选择另辟蹊径,率先选择了离线语音AI芯片的方向。
启英泰伦为何作出这一选择呢?对此,启英泰伦创始人兼CEO何云鹏表示,这一选择的出发点是基于对用户真实需求的深入思考。首先,离线语音是不依赖网络和云中心的真智能,既能给用户带来即时的灵敏响应,也能更好地保护用户的隐私。此外,离线语音能确保用户拥有完整自主的智能设备使用权和控制权。
近年来,随着智能语音技术不断发展和应用的不断拓展,云端处理在响应可靠性、隐私保护、成本等方面的问题愈发受到用户重视。在端云融合的趋势之下,离线语音AI芯片则为隐私安全筑起了一道“保护墙”。
从实际应用场景来看,智能语音的需求大致可以概括为语义理解、特征识别、语音处理、实时交互四个方面。启英泰伦在算法攻关和芯片研发两个方面同时发力,至今启英泰伦自研技术平台BNPU(脑神经网络处理器)已迭代三次,从BNPU 1.0、BNPU 2.0,一直到此次推出的BNPU 3.0版本。
每一代BNPU的问世,都是离线语音芯片在算法和语音应用上的一次突破,此次发布的第三代芯片又将把整个语音识别应用推向新的高点。
从芯片算力方面看,三代13系列芯片内置BNPU 3.0和支持DSP指令扩展的RISC CPU两大内核,主频高达240MHz,并具有640KB系统SRAM。
何云鹏讲到,在实际应用中,用户对智能语音的要求极高。比如,在人耳也不易听清的嘈杂环境中,会希望语音设备能听清;人耳很难同时听懂两个以上人说话,但要求语音设备能听懂。此外,很少有人能听懂各地的方言口音,但各地方的人会要求设备听得懂该地方言,甚至土话,“ 第三代BNPU作了大量技术迭代则可以满足上述要求。”他说。
据介绍,除继承第二代的语音识别、声纹识别外,还支持了基于深度学习的降噪技术(深度降噪),人声分离技术(深度分离),命令词自学习2.0版本技术,以及行业首次突破性的离线NLP技术。
为了帮助下游客户实现快速开发落地的目标,启英泰伦还推出了语音AI平台。该平台支持10000用户同时开发,即时生成NLP模型,提供更自然的语音交互能力。
随着互联网、5G和Wi-Fi等技术的快速发展,智能行业正从“单点智能”走向“情景智能”。在这一趋势中,专业的智能语音芯片技术将扮演着至关重要的角色。
目前,智能语音已智能家居、智慧生活、智慧办公、智慧医疗、智能客服等2C消费级和2B企业级等多个领域实现场景应用。
据IDC的统计数据,2021年中国智能家居设备市场出货量已超2.2亿台,2022年中国智能家居设备市场出货量则将突破2.6亿台,同比增长为17.1%。
“启英泰伦的终极目标是打造跨设备、跨时空,用户专属,终身守护的守护精灵。”何云鹏将这一目标划分为三个阶段。第一步是让人机交互更自然,更具普适性;然后通过更多的数据,让机器更理解人、更主动地为人类服务;最终目标是打造专属的守护精灵,它将是用户全方位的生活管家、健康安全卫士、百科知识老师和给陪伴者。
目前,启英泰现积累B端客户超过5000名,平台开发者则超过了1万名,使用启英泰伦智能语音平台的在校AI学员则超过10万名。离线语音方案的年装机量则超过2000万,并正快速向上亿年装机量发展。
文字:郑其
受访企业供图
编辑:向策