不久前,我們收到一條公開點(diǎn)贊——
香港立法會(huì)主席梁君彥在社交平臺(tái)發(fā)文點(diǎn)贊的“智識(shí)聽”系統(tǒng),是香港立法會(huì)與科大訊飛聯(lián)合打造的智慧謄錄系統(tǒng)。
“智識(shí)聽”深度適配立法會(huì)場(chǎng)景的實(shí)時(shí)字幕功能,運(yùn)用科大訊飛中英粵混讀引擎,結(jié)合聲紋識(shí)別和字幕與幀畫面對(duì)齊壓制技術(shù),實(shí)現(xiàn)會(huì)議直播中文字和視頻畫面的同軌顯示,公眾可通過實(shí)時(shí)字幕無障礙獲取政策資訊,沉浸見證民主議政的全過程。
今天給大家分享一下,這背后的故事。
香港立法會(huì)來了一位AI字幕君
香港立法會(huì)是中華人民共和國香港特別行政區(qū)的立法機(jī)關(guān),根據(jù) 《中華人民共和國香港特別行政區(qū)基本法》設(shè)立,負(fù)責(zé)制定、修改和廢除法律,并監(jiān)督政府工作。
第七屆立法會(huì)由90名議員組成,立法會(huì)在會(huì)期內(nèi)通常逢星期三上午11時(shí)在立法會(huì)綜合大樓會(huì)議廳舉行會(huì)議,議員及官員可用普通話、粵語或英語發(fā)言,會(huì)議席上提供即時(shí)傳譯服務(wù),并向公眾直播。
同時(shí),立法會(huì)會(huì)議的過程會(huì)逐字記錄,一般被稱為議事錄,在立法會(huì)結(jié)束后向公眾發(fā)放。
以往,立法會(huì)一場(chǎng)會(huì)議從召開到向公眾發(fā)放議事錄大概需要7個(gè)工作日,信息發(fā)布稍顯滯后。
2022年,梁君彥得知科大訊飛作為內(nèi)地人工智能領(lǐng)域的頭部企業(yè),自2021年起開始承擔(dān)全國人大會(huì)議的相關(guān)語音轉(zhuǎn)寫工作,平均準(zhǔn)確率高達(dá)96%。他召集立法會(huì)的同事,經(jīng)過數(shù)次交流考察,與科大訊飛達(dá)成了合作計(jì)劃。
“智識(shí)聽”深度學(xué)習(xí)2.5億字語料、400小時(shí)音頻、20萬條香港特色關(guān)鍵詞,口音、新地名、混語發(fā)言實(shí)時(shí)適配,即使面對(duì)議員特殊口音或復(fù)雜地名也能高效處理。
目前,實(shí)時(shí)字幕的準(zhǔn)確率達(dá)96%,通過幕后同事的即時(shí)修正,準(zhǔn)確率通過人機(jī)結(jié)合可達(dá)99%。
“智識(shí)聽”實(shí)時(shí)字幕準(zhǔn)確輸出
除了90名議員之外,立法會(huì)綜合大樓內(nèi)還有議員辦事處職員和立法會(huì)秘書處職員等也要深度使用“智識(shí)聽”,約有1000名使用者。同時(shí),立法會(huì)會(huì)議通過各種渠道向公眾直播,為數(shù)百萬香港民眾服務(wù)。
從此,香港朋友們都可以通過這位“AI字幕君”,及時(shí)見證立法會(huì)全過程了。這標(biāo)志著香港立法公開透明化邁出關(guān)鍵一步,也為粵港澳大灣區(qū)數(shù)字政務(wù)建設(shè)樹立了新標(biāo)桿。
實(shí)時(shí)字幕更準(zhǔn)了
議事錄發(fā)放更快了
“智識(shí)聽”正式調(diào)研、研發(fā)、上線歷時(shí)近三年,從1.0版本的錄音轉(zhuǎn)文字到2.0版本的實(shí)時(shí)轉(zhuǎn)文字,再到3.0版本的實(shí)時(shí)字幕,背后是合作雙方的共同努力。
“智識(shí)聽”項(xiàng)目初始,粵語的識(shí)別率不太高。
一是因?yàn)榱⒎〞?huì)議員使用的粵語俚語和法律專業(yè)術(shù)語較多; 二是因?yàn)椴糠肿h員的粵語有口音,既有老香港口音,也有廣東等各地方言口音; 三是大家的語言習(xí)慣是中英粵混雜,導(dǎo)致機(jī)器識(shí)別率降低。
怎么辦?為了解決這一問題,立法會(huì)秘書處整理了2.5億漢字的中英文對(duì)照和20萬個(gè)高頻粵語詞匯,將其作為語料庫提供給機(jī)器學(xué)習(xí)。經(jīng)過數(shù)據(jù)和算法的優(yōu)化和不斷的訓(xùn)練,立法會(huì)會(huì)議實(shí)時(shí)字幕的準(zhǔn)確率達(dá)96%。
會(huì)議的逐字記錄效率也因此項(xiàng)技術(shù)的落地大幅提升。原先,需要7個(gè)工作日才能發(fā)布的議事錄,會(huì)議召開后第二天即可發(fā)布。
梁君彥多次在社交媒體推介“智識(shí)聽”系統(tǒng),并在采訪中表示要將其推薦給英聯(lián)邦國家。他說:“科技是時(shí)代的高鐵,你如果上不去,就會(huì)被社會(huì)的發(fā)展拋下。這幾年,內(nèi)地在人工智能領(lǐng)域的發(fā)展日新月異,香港也不能掉隊(duì),要積極與內(nèi)地科技企業(yè)合作,推動(dòng)立法會(huì)智慧化轉(zhuǎn)型?!?/p>
智識(shí)聽的背后是“實(shí)戰(zhàn)”經(jīng)驗(yàn)豐富的訊飛聽見多語種會(huì)議系統(tǒng)。
科大訊飛項(xiàng)目經(jīng)理張坤介紹:訊飛聽見多語種會(huì)議系統(tǒng),已服務(wù)全國人民代表大會(huì)4年,服務(wù)中國人民政治協(xié)商會(huì)議7年。
在2025年的十四屆全國人大三次會(huì)議上,提供了160套智慧簡(jiǎn)報(bào)系統(tǒng),服務(wù)34個(gè)代表團(tuán),完成1290小時(shí)會(huì)議記錄和轉(zhuǎn)寫1875萬字,識(shí)別率96.2%;在全國政協(xié)十四屆三次會(huì)議上,提供了60套智慧簡(jiǎn)報(bào)系統(tǒng),支撐372場(chǎng)分組會(huì)議,覆蓋58個(gè)界別。
張坤透露,目前智識(shí)聽四期正在準(zhǔn)備中,該期將建設(shè)英語字幕和多語種字幕系統(tǒng)。同時(shí),基于星火大模型的進(jìn)步,香港立法會(huì)的智慧辦公系統(tǒng)也提上日程。
香港作為科大訊飛國際化戰(zhàn)略的重要橋頭堡,是多語言場(chǎng)景的最佳試驗(yàn)場(chǎng)。科大訊飛在港將有越來越多的AI應(yīng)用,助力打破語言壁壘,助力世界溝通!
-
AI
+關(guān)注
關(guān)注
90文章
38414瀏覽量
297711 -
科大訊飛
+關(guān)注
關(guān)注
19文章
853瀏覽量
63234
原文標(biāo)題:香港立法會(huì)來了一位AI字幕君
文章出處:【微信號(hào):iFLYTEK1999,微信公眾號(hào):科大訊飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
2025科大訊飛全球1024開發(fā)者節(jié)精彩回顧
科大訊飛發(fā)布訊飛星火X1.5及系列AI產(chǎn)品
科大訊飛加速東南亞企業(yè)的人工智能應(yīng)用
科大訊飛亮相第137屆廣交會(huì)
科大訊飛深度解析DeepSeek-V3/R1推理系統(tǒng)成本

香港立法會(huì)與科大訊飛聯(lián)合打造智慧謄錄系統(tǒng)“智識(shí)聽”
評(píng)論