重磅公开！阿里语音识别模型端核心技术，让你“听”见未来(4)

发布时间：2019-01-22 04:58 所属栏目：19 来源：鄢志杰、薛少飞、张仕良、郑昊、雷鸣

导读：在算力方面自不用说，这本身就是云计算的天然强项。基于阿里云 ODPS-PAI 平台，我们构建了专为语音识别应用优化的 CPU/GPU/FPGA/NPU 训练和服务混布平台，每天服务于阿里云上巨量的语音识别请求。在数据方面，我们

在“算力”方面自不用说，这本身就是云计算的天然强项。基于阿里云 ODPS-PAI 平台，我们构建了专为语音识别应用优化的 CPU/GPU/FPGA/NPU 训练和服务混布平台，每天服务于阿里云上巨量的语音识别请求。在“数据”方面，我们提供通过海量数据训练的、开箱即用的场景模型，包括电商、客服、政务、手机输入等等。

同时应该看到，在具体的落地场景下往往会有一些非常特殊、领域相关的“说法”需要被识别，很多时候类似于“碎屑岩岩性地层”、“海相碳酸盐岩”这种特定说法对于通用场景模型的识别率提出了挑战。要获得开发者关心的具体场景下最佳的准确率，开箱即用的模型一般还需要一定的定制优化工作才可以达到。传统上，这样的定制是通过语音技术服务提供商来完成的，在成本、周期、可控性等方面都存在明显不足。

阿里云提供的语音定制“自学习”平台服务，可以提供多种手段，在很短的时间内、以较低的成本，让开发者完全掌控模型定制优化及上线的工作。阿里云创新工具平台及服务技术，依托强大的基础设施，使得在云计算的大背景下进行大规模定制化语音服务成为可能。而开发者完全无需关心后台的技术和服务，只需要使用阿里云提供的简单易用的“自学习”工具，利用场景知识和数据，就可以获得该特定场景下最优的效果，并按需要持续迭代提升。

阿里云的智能语音自学习平台具备以下优势：

易：智能语音自学习平台颠覆性地提供一键式自助语音优化方案，极大地降低进行语音智能优化所需要的门槛，让不懂技术的业务人员也可以来显著提高自身业务识别准确率。
快：自学习平台能够在数分钟之内完成业务专属定制模型的优化测试上线，更能支持业务相关热词的实时优化，一改传统定制优化长达数周甚至数月的漫长交付弊端。
准：自学习平台优化效果在很多内外部合作伙伴和项目上得到了充分验证，很多项目最终通过自学习平台不光解决了效果可用性问题，还在项目中超过了竞争对手使用传统优化方式所取得的优化效果。

举例来说，开发者可以使用下述多种“自学习”手段来定制自己关心领域的模型：

a)业务热词定制

在许多特定场所，要求快速对特定词的识别能力进行加强（注：包括两种模式，模式一为其他词易被识别成特定词；模式二为特定词易被识别成其他词），采用实时热词加载技术，可以在实时场景下，通过设置不同的档位，能够实现热词识别能力的加强。

b)类热词定制

很多时候，相同的发音相同的属性在不同上下文上会需要不同的识别效果。联系人和地名就是典型的案例，对于不同人的好友，“张阳”和“章扬”我们就必须能准确地识别出相应的名字。同样，相隔千里的安溪跟安西如果识别错误会给导航带来大麻烦。智能语音自学习平台相信“每个人都值得被尊重”，提供联系人类和地名类的定制能力，“让天下没有难识的路”。

重磅公开！阿里语音识别模型端核心技术，让你“听”见未来

c)业务专属模型定制

用户通过输入对应领域的相关文本，如行业或公司的基本介绍、客服聊天记录、领域常用词汇和专有名词等，即可快速自行生成该行业下的定制模型，整个定制过程无需用户人工干预。

重磅公开！阿里语音识别模型端核心技术，让你“听”见未来

通过这些手段，阿里云使得开发者不必关心语音技术的算法和工程服务细节，专注于他们擅长的垂直领域的知识和数据收集，实现全新的语音技术云端供给模式，造福于广大的开发者及其业务结果。

【编辑推荐】

寻找学术大牛|近十年人工智能21个子领域高引学者
50个抢票加速包，还不如这个Python抢票神器_技术栈微信半月刊第33期
技术人好不容易升职，不会管理该怎么办
AI | 天呐噜！人工智能竟彻底消灭了Bug
微软CEO纳德拉：面部识别技术对社会危害大

【责任编辑：张燕妮 TEL：（010）68476606】
点赞 0

（编辑：ASP站长网）