上海动漫音乐分享社区

VOC语音链背景(二)| 社区技术使命与愿景

VocalChain语音链2019-02-20 09:01:53

VOC语音链是基于区块链技术的语音资料与人工标识信息存储工具。VOC语音链致力于建设辐射全球的语料资源平台,通过社群成员协作的力量为AI语音识别的发展提供全球最大、最丰富、最精准的训练数据源,实现打造全球最大的去中心化人类语音数据生态愿景。真正让数据“取之于民,用之于民”。



▍使命一 搭建公有语料收集平台

VOC语音链利用区块链技术的公开性与不可篡改性,从语音数据资源入手,减少信息重复采集,防止资源浪费;降低行业的竞争门槛,使得行业竞争回归与技术竞争而非资本内耗,促进行业的良性发展。


任何合法的公司及个人,都可以通过上传语音及人工识别信息的方式挖矿,并根据其贡献大小取得代币VOC;任何合法的公司及个人,也都可以通过支付代币的方式获取相应的数据。语料信息通过VOC语音链得以充分地流动。早期的高额的VOC代币回报与代币未来的上涨预期将吸引用户大量上传语料信息;而蓬勃的市场需求又将再次推高VOC代币的价格,使得语料信息与代币价格交替增长,实现良性互动,使得VOC语音链上的语料信息能够满足现实的研究需要。


▍使命二 建立安全、公正的去中心化语音信息存储平台 


众所周知,语音信息资源的采集依赖于特定的对象,其性质、内容与人身权利都高度相关,涉及到公民的人格权益,故在使用时应当受到严格的限制。政府监管无法深入公司的肌理,既需要付出高昂的成本,也无法真正消除信息泄露的风险。VOC语音链基于区块链技术的不可篡改、分布式存储与去中心化,从根本上保证了大数据的安全性,并极大地扩展了大数据的规模与丰富性。数据统一存储在去中心化的区块链上,在不访问原始数据情况下进行数据分析,既可以对数据的私密性进行保护,又可挖掘更多的数据价值。


同时VOC语音链将发挥社区力量,组成仲裁争议解决机构,利用公有链不可篡改的性质,将仲裁过程中的全部信息记录上链,实现完全公开透明,接受成员监督。



▍使命三 建立方言与濒危语种的语音研究社区


根据联合国教科文组织发布的《世界濒危语言地图》,截至2013年,全世界有6000多种语言,但是60亿人口中,大约80%的人讲的都是主要的83种语言,而剩下的6000多种里,有2500种被列为濒危语言,其中的绝大多数甚至没有任何的文字记载,有228种语言几近消失。


VOC语音链对上传的语料信息不断深加工,将语料信息的上传时间、上传地点与语料种类、准确程度分门别类记录在链上,一经确认记录,不可篡改。方言与濒危语种使用者就可以通过智能终端将语言信息通过录音、标注、上传的方式将语料信息记录在VOC语音链上。社区成员共同协作校对、确认、储存、整合,形成规模效应,实现濒危语种的传承,为将来的研究提供充足的素材基础。


▍使命四 响应国家战略 肩负社会责任


2017年12月9日,习近平总书记在中共中央政治局第二次集体学习时曾强调:“实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发展和人民生活改善”。


VOC语音社区正致力于响应国家战略,革除行业弊端,创立统一的语音信息资源库,降低资源内耗,帮助中国AI语音行业乃至人类社会语音识别技术以及更快速发展。