shanghai security defense & alarm association 愛建網">
近日,云從科技在語音識別技術上獲得重大突破,一舉刷新了全球最大的開源語音識別數據集Librispeech的世界紀錄,錯詞率(Worderrorrate,WER)降到了2.97%,將Librispeech的WER指標提升了25%,超過阿里、百度、約翰霍普金斯大學等企業及高校,大幅刷新原先記錄。
此次突破標志著云從科技在今年4月刷新跨鏡追蹤技術(ReID)三項世界紀錄后在新領域再次取得重大成果,正全力夯實核心技術閉環。
根據介紹,云從科技核心技術閉環包括人臉識別、智能感知與智能分析三個階段,而此次語音識別突破屬于智能感知中的一環。智能感知即視覺、聽覺、觸覺等感知能力,能夠讓計算機通過各種智能感知能力與外界進行交互。
據了解,Librispeech是當前衡量語音識別技術的最權威主流的開源數據集,錯詞率(Worderrorrate,WER)是衡量語音識別技術水平的核心指標。云從科技在Librispeech數據集上刷新了業內最好的水平,將錯詞率(Worderrorrate,WER)降到了驚人的2.97%,較之前提升了25%,已超越人類專業速記員水平。
滬公網安備 31011202001934號