閱讀足跡 永久書架

第24章 小樣本學習 (第1/2頁)

琅翎宸提示您:看後求收藏(筆趣閣小說www.biqugexsw.tw),接著再看更方便。

“樣本?就是說你要1201同本地人多交流是嗎?”尹秋並沒有學過這些東西,因此聽起來雲裡霧裡的,“可這樣必然進入惡性迴圈——1201聽不懂,不回應,缺乏與本地人的互動,交流減少,而越不交流,1201就越聽不懂。”

1201所使用的學習方式,是比較新穎的“小樣本學習”(Few-shot learning)。這種樣本學習方式,不僅對機器學習領域有著重大意義,也同樣具有挑戰性。能否從少量樣本中學習和概括的能力,是將人工智慧和人類智慧進行區分的明顯分界點。因為人類可以僅透過少量示例就可以輕鬆地建立對新事物的認知,而機器學習演算法通常需要大量的有監督樣本來保證泛化能力。

但由於隱私,安全性等一系列因素,許多現實的場景,例如醫學,軍事等領域,根本無法收集到足夠的帶標籤的訓練樣本。因此,徐遠風才決定讓1201使用這種尚未完善的“小樣本學習”(Few-shot learning)訓練方法。

徐遠風當然不會跟尹秋說這些涉及專業知識的方面,他要用更簡單的方法來解釋。

“樣本,我需要各類方言的樣本,你要知道,我們訓練AI不是憑空訓練的,樣本非常重要。”徐遠風一邊解釋,一邊拿起紙筆,在紙上畫著,好讓尹秋能理解他說的話。

“比如,有些公司做的是繪畫的AI,就需要將很多畫作當做樣本給AI做訓練。”徐遠風在紙上簡單地畫了個思維圖,“而有些創作者,為了省力,他們會將自己的畫作作為樣本,這種行為,有些人會稱為‘喂’,比如說,把自己的畫‘喂’給AI,這樣AI就能以你的畫風來進行AI作畫。”

“同樣的道理,想要AI理解方言,也是需要將各種不同地區的方言,甚至於各種語速、情緒來‘喂’給AI。”

“所以你需要一個能涵蓋當地各種方言,甚至各種年齡段、各種情緒的樣本是嗎?”尹秋聽了,只是覺得這樣難度過高,而且別人也不是閒的沒事幹,把鄉親們從日常生活中拉出來跟1201說話,怕不是要不少經費。

“我知道你在想什麼,你可能覺得需要經費,但實際上不需要,因為目前這個階段我們的資料模型只負責接受各種方言,然後進行分析就好,而不是方言方面的輸出。這也就是前些天明明出了方言不能識別那種事,我還要將1201帶出去測試的原因——它需要足夠的積累。”

“年輕人工作重要,但身體也重要,來新疆要好好調整作息,才能勞逸結合。”阿依莎大嬸站在門口,出聲提醒二人,免得二人因為天還亮著就不去睡覺,導致明天工作出問題。

“好的,我們會注意時間的。”尹秋笑著回應。

徐遠風伸長脖子,見大嬸上樓後,小聲說:

“你說大嬸會不會發現咱倆的關係吧?天天交流這麼多。”

尹秋感到好笑,感情沒破裂那段時間,徐遠風下班沒事的時候恨不得黏在自己身上,現在倒還注意起影響來了?

“都說了是工作的事情,大嬸不會懷疑的。”

“也是,”徐遠風轉向桌前,“我要寫程式碼了,你自己玩吧。”

“哄小孩呢?”尹秋這下真給徐遠風逗得笑出聲了。

她轉身上樓,回到自己房間。

尹秋也有事要做,經過下午的討論與主任的拍板,他們決定拍一個宣傳影片——不用航拍,也不用很高階的剪輯技巧,而是用最樸實的方法記錄古城最真實的美好瞬間。

雖然樸實,但該做的事情還是要做,她需要先寫出一個影片指令碼。這樣,不論是回頭外包給其他公司還是融媒體中心自己拍都能有一個基本的參照。

提到這個,她就有些來氣。

討論的時候特意提到了影片拍攝是否要外包出去的問題,主任堅持“專業的事情讓專業的人來幹”,而她多年的工作經歷告訴她,外包的公司常常為了體現自身的“專業性”,會在裡面加“高階大氣”的剪輯和手法,這樣很明顯和他們之前的初衷背道而馳。

至於張饒,在二人討論得熱火朝天的時候猛打圓場和稀泥。

閉上雙眼,她回憶起了之前在古城裡看見的木雕工藝……

思路開啟——

跟隨鏡頭的步伐,穿過充滿著維吾爾特色的大街小巷,走進古城的深處,一個招牌顯現出歷史的厚重與滄桑。

走入小店,映入眼簾的是一張小小的桌板。幾個木雕和木碗被隨意地擺放在桌板上。

《滬風疆韻》 第24章 小樣本學習(第1/2頁),本章未完,點選下一頁繼續閱讀。