bl双性厨房裸体围裙_一本大道一卡二卡三卡_2019年中文字字幕在线看不卡_中文字幕日产乱码天堂

首頁 | 資訊 | 財經(jīng) | 公益 | 彩店 | 奇聞 | 速遞 | 前瞻 | 提點 | 網(wǎng)站相關(guān) | 科技 | 熱點 | 生活 |
月活躍用戶1.15億!“小愛同學(xué)”是如何成長的?_當(dāng)前熱門

發(fā)稿時間:2023-05-23 22:35:53 來源: 北京日報

“小愛同學(xué)”“我在”……每一天,這樣看似簡單的對話會在全球重復(fù)1億次以上?!靶弁瑢W(xué)”如今已成為許多人智能生活中不可或缺的一部分。


(資料圖片)

小米集團人工智能實驗室語音組部分成員正在開會

在這套強大的智能語音交互系統(tǒng)背后,有一支約90人的隊伍,不斷為完善語音交互技術(shù)、提升用戶體驗努力著。他們就是小米集團人工智能實驗室語音組。今年“五一”前夕,他們榮獲了“全國工人先鋒號”榮譽稱號。

2017年1月,小米人工智能實驗室語音組成立,當(dāng)時整個團隊只有4個人。4個月后,語音組就開發(fā)出了小米第一個語音識別系統(tǒng),并應(yīng)用于小米電視,實現(xiàn)了可以通過語音方式搜索、播放電視節(jié)目。

團隊帶頭人、小米集團聲學(xué)語音技術(shù)總監(jiān)王育軍把這段經(jīng)歷戲稱為“444歲月”,“4個人,經(jīng)過40多次試驗,歷時4個月,不但上線了語音識別系統(tǒng),還發(fā)表了相關(guān)論文?!?在王育軍看來,首戰(zhàn)告捷的小小成功其實難度并不大,接下來的小米音箱語音喚醒功能開發(fā),才是第一塊“硬骨頭”。

小米集團人工智能實驗室語音組部分成員正在開會

“我們要進行語音交互,先得成功叫醒它,這是第一道環(huán)節(jié),所以喚醒的成功率和誤喚醒率都非常重要?!蓖跤娊忉?,所謂成功喚醒,就是當(dāng)用戶呼叫“小愛同學(xué)”時,系統(tǒng)能準(zhǔn)確地識別出來是在進行喚醒;而誤喚醒,就是毫不相關(guān)的聲音或是發(fā)音近似的聲音,也會喚醒音箱,“比如半夜大家都睡覺呢,鼾聲或是戶外的蛐蛐聲都會喚醒音箱,那肯定不行,這種對用戶的打擾是非常嚴(yán)重的?!?/p>

回想起這段時光,小米集團聲學(xué)語音算法工程師王永慶形容為“非常難”,“剛開始做的時候是沒有數(shù)據(jù)的?!焙唵蝸碚f,要讓系統(tǒng)識別出哪些聲音是在喚醒,哪些不是,需要一個龐大的聲音數(shù)據(jù)庫做基礎(chǔ),包括“小愛同學(xué)”這四個字,也需要有不同音色、不同口音、不同環(huán)境音下等多種情形做素材。于是,團隊成員們不但自己錄制聲音素材,還請同事幫忙,那段時間,大家經(jīng)常能看到王永慶提著飲料、小零食,笑瞇瞇地四處招攬同事,“來幫我們錄一段啊!”

突破,并不容易。半年后,誤喚醒率依然無法達到預(yù)期目標(biāo),團隊成員們開始有些動搖,但王育軍堅信,“技術(shù)的事兒,只要符合常識,沉下心不慌,就一定能做出來。”于是,一個45天計劃誕生了,團隊成員兵分三路,采取三種不同的方法,共同向著一個目的地前進,最終,把誤喚醒率控制在了一天一次,進而一周四次,且仍在不斷降低。

語音識別,為“小愛同學(xué)”裝上了“耳朵”,但要能聽會說,還要有“嘴巴”。于是,語音組研發(fā)推出了語音生成技術(shù),可以將文本轉(zhuǎn)化成語音,甚至還能自動譜曲、編曲、合成歌曲等等。其中,超級擬人語音合成技術(shù)最大限度模擬真人說話方式,不只是語氣,甚至連人類說話時的猶豫、停頓、變速、嘆息等習(xí)慣也能復(fù)刻,使語音合成效果更加自然流暢。

為用戶帶來智能生活新體驗的同時,小米始終關(guān)注智能設(shè)備無障礙建設(shè)。“聲音天然應(yīng)該服務(wù)于無障礙?!痹谕跤娍磥?,無論是視障人群、聽障人群、語言障礙人群還是肢端殘障人群,都可以通過人機交互的不同模態(tài)、利用聲音去彌補缺失的能力。

于是,語音組為聽障人群開發(fā)了“聞聲技術(shù)”,讓聽障人群可以通過手機、平板電腦等智能設(shè)備“看到”其他人說話,也可以幫他們“看見”周圍環(huán)境中的聲音,例如警報聲,敲門聲等;“讀屏技術(shù)”讓視障人群“聽到”屏幕上的內(nèi)容;語音合成技術(shù),為失去語言能力的用戶發(fā)出聲音;“聆聽”技術(shù)為構(gòu)音困難用戶提供了個性化的語音識別,讓他們也可以通過語音和設(shè)備交互,這項技術(shù)還被提名為2021年世界互聯(lián)網(wǎng)領(lǐng)先科技成果。

到去年年底,小米人工智能實驗室聲學(xué)語音組已將自研聲學(xué)語音技術(shù)全面應(yīng)用于小米手機、音箱、電視、耳機、手表、機器人等79個品類,共計5312款智能產(chǎn)品中?!靶弁瑢W(xué)”月活躍用戶數(shù)量為1.15億,已成為是世界上最忙的語音助手之一。

“科技發(fā)展的根本目的是作用于人的生活,我們希望通過自己的努力,讓語音科技更有溫度,讓越來越多的用戶享受到更好的體驗感?!蓖跤娬f。

攝影 彭程

來源:北京日報客戶端 記者:王天淇

流程編輯:u060

版權(quán)說明:任何媒體、網(wǎng)站或個人未經(jīng)書面授權(quán)許可不得轉(zhuǎn)載、摘編或利用其它方式使用本網(wǎng)站上的文字、圖片、圖表、漫畫、視頻等內(nèi)容。

未經(jīng)許可即使用,或以此盈利的,均系侵害本網(wǎng)站著作權(quán)及相關(guān)權(quán)益的行為,本網(wǎng)站將追究法律責(zé)任。

如遇作品內(nèi)容、版權(quán)等問題,請在相關(guān)文章刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系。

聯(lián)系方式:takefoto@vip.sina.com

標(biāo)簽:

責(zé)任編輯:mb01

網(wǎng)站首頁 | 關(guān)于我們 | 免責(zé)聲明 | 聯(lián)系我們

生活晚報網(wǎng)版權(quán)所有

Copyright @ 1999-2017 gaoerwen.cn All Rights Reserved豫ICP備2022016495號-7

聯(lián)系郵箱:939 674 669@qq.com