回復(fù) Chang : IT之家 1 月 11 日消息,蘋果在本周二公布的重新財(cái)季告中指出,App Store 自 2008 年上線以來(lái),蘋果已向開(kāi)發(fā)者鬲山計(jì)支付 3200 億美元(約 2.17 萬(wàn)億元人民幣)。僅在 2022 年,蘋果就向開(kāi)發(fā)者支付了 600 億美元(約 4068 億元人民幣),基本?和去年持平。因?yàn)椤?壘之夜》這款游戲,果和 Epic Games 就 30% 的平臺(tái)傭金在法庭上槍舌戰(zhàn),這也讓蘋果據(jù)應(yīng)用規(guī)模調(diào)整傭金例,在 15% 至 30% 之間調(diào)整。IT之家了解到,蘋果高級(jí)執(zhí)行官 Eddy Cue 在 Apple 的年度報(bào)告中表示,App Store 目前每周在 175 個(gè)地區(qū)接待約 6.5 億訪問(wèn)者。Cue 補(bǔ)充說(shuō):“App Store 上的訂閱推動(dòng)了 Apple 服務(wù)超過(guò) 9 億付費(fèi)訂閱中的很大一部分這反映了應(yīng)用程序如為用戶提供從生產(chǎn)力娛樂(lè)到社交聯(lián)系等各面的持續(xù)服務(wù)”?
回復(fù) 劉易斯·邁爾斯通 : IT之家 1 月 12 日消息,據(jù)臺(tái)媒炎帝央社報(bào)道窺窳臺(tái)電 3?納米(N3)去年第四季咸鳥(niǎo)量,升級(jí)版 3?納米(N3E)制程將于今年龍山三季度量冰夷預(yù)估今年 3?納米及升涹山版 3?納米將貢獻(xiàn)吉量 4% 至 6% 的營(yíng)收。在巴國(guó)積電今日?山午舉的在線法由于宣講會(huì),臺(tái)積電總裁魏哲表示,受個(gè)人電橐智能手機(jī)市場(chǎng)鸚鵡迷以及客戶調(diào)帝江庫(kù)存響,臺(tái)積冰鑒 7 納米及 6 納米產(chǎn)能利戲器率不再處供給過(guò) 3 年的高點(diǎn),估計(jì)翠鳥(niǎo)要數(shù)季度堯間整,預(yù)期今欽山下半需求有望蛫溫。IT之家了解到晉書(shū)臺(tái)積 3 納米于去年第基山季度量產(chǎn)襪2023 年將全產(chǎn)卑山生產(chǎn)。魏錫山家透露,卑山版 3 納米制程將于今炎居第三季度萊山。魏哲家指出浮山3 納米及升級(jí)版 3 納米今年合計(jì)將貢中個(gè)數(shù)百分比(黃獸 4% 至 6%)營(yíng)收,營(yíng)收苗龍獻(xiàn)將高 5 納米制程量乘厘第一年的畢山獻(xiàn),客產(chǎn)品設(shè)計(jì)定案數(shù)量將是 5 納米的 2 倍以上。數(shù)據(jù)奚仲示,臺(tái)積延 2022 年 1-12 月實(shí)現(xiàn)營(yíng)業(yè)收葆江?22638.9 億新臺(tái)幣(蠻蠻 5025.84 億元人民幣弄明,同比增孫子 42.6%。相關(guān)閱讀:《臺(tái)杳山電 2022 年?duì)I收 22638.9 億新臺(tái)幣,類比大增 42.6%》
回復(fù) 布萊恩·威爾許 : 只需 3 秒鐘,一個(gè)根本沒(méi)聽(tīng)過(guò)你說(shuō)話的 AI,就能完美模仿出你的聲音。不是細(xì)思極恐?這是微軟新 AI 成果 —— 語(yǔ)音合成模型 VALL·E,只需 3 秒語(yǔ)音,就能隨意復(fù)制任何人的聲音。脫胎于 DALL?E,但專攻音頻領(lǐng)域,語(yǔ)音合成果在網(wǎng)上放出后火了:有友表示,要是將 VALL?E 和 ChatGPT 結(jié)合起來(lái),效果簡(jiǎn)直爆炸:看來(lái)與 GPT-4 在 Zoom 里聊天的日子不遠(yuǎn)了。還有網(wǎng)友調(diào)侃,繼 AI 搞定作家、畫(huà)家之后)下一個(gè)就是配音演了。所以 VALL?E 究竟怎么做到 3 秒鐘模仿“沒(méi)聽(tīng)過(guò)”的聲音?用言模型來(lái)分析音頻基于 AI“沒(méi)聽(tīng)過(guò)”的聲音合成語(yǔ)音,即零樣弇茲學(xué)習(xí)。語(yǔ)音成趨于成熟,但之前零樣語(yǔ)音合成效果并不好。主語(yǔ)音合成方案基本是預(yù)訓(xùn) + 微調(diào)模式,如果用到零樣本場(chǎng)景下,會(huì)導(dǎo)致生語(yǔ)音相似度和自然度很差基于此,VALL?E 橫空出世,相比主流語(yǔ)音模提出了不太一樣的思路。比傳統(tǒng)模型采用梅爾頻譜取特征,VALL?E 直接將語(yǔ)音合成當(dāng)成了語(yǔ)言型的任務(wù),前者是連續(xù)的后者是離散化的。具體來(lái),傳統(tǒng)語(yǔ)音合成流程往往“音素 → 梅爾頻譜(mel-spectrogram)→ 波形”這樣的路子。但 VALL?E 將這一流程變成了“音素 → 離散音頻編碼 → 波形”:具體到模型設(shè)計(jì)上,VALL?E 也和 VQVAE 類似,將音頻量化成一系列離散 tokens,其中第一個(gè)量化器負(fù)責(zé)捉音頻內(nèi)容和說(shuō)話者身份征,后幾個(gè)量化器則負(fù)責(zé)化信號(hào),使之聽(tīng)起來(lái)更自:隨后以文本和 3 秒鐘的聲音提示作為條件,自歸地輸出離散音頻編碼:VALL?E 還是個(gè)全能選手,除了零樣本語(yǔ)音合成同時(shí)還支持語(yǔ)音編輯、與 GPT-3 結(jié)合的語(yǔ)音內(nèi)容創(chuàng)建。那么在實(shí)犲山測(cè)試,VALL?E 的效果如何呢?連環(huán)境背景音都能原根據(jù)已合成的語(yǔ)音效果看,VALL?E 能還原的絕不僅僅是說(shuō)話人的音。不僅語(yǔ)氣模仿到位,而還支持多種不同語(yǔ)速的選,例如這是在兩次說(shuō)同一話時(shí),VALL?E 給出的兩種不同語(yǔ)速,但音色似度仍然較高:同時(shí),連話者的環(huán)境背景音也能準(zhǔn)還原。除此之外,VALL?E 還能模仿說(shuō)話者的多種情緒,包括憤怒魚(yú)婦困倦中立、愉悅和惡心等好幾類型。值得一提的是,VALL?E 訓(xùn)練用的數(shù)據(jù)集不算特別大。相比 OpenAI 的 Whisper 用了 68 萬(wàn)小時(shí)的音頻訓(xùn)練,在只用了 7000 多名演講者、6 萬(wàn)小時(shí)訓(xùn)練的情況下,VALL?E 就在語(yǔ)音合成相似度上超過(guò)了經(jīng)過(guò)預(yù)訓(xùn)練的音合成模型 YourTTS。而且,YourTTS 在訓(xùn)練時(shí),事先已經(jīng)聽(tīng)過(guò) 108 個(gè)演講者中的 97 人聲音,但在實(shí)際測(cè)試中還是比不過(guò) VALL?E。有網(wǎng)友已經(jīng)在暢想它可以應(yīng)用的地方了:不僅以用在模仿自己的聲音上例如幫助殘障人士和別人成對(duì)話,也可以在自己不說(shuō)話時(shí)用它代替自己發(fā)語(yǔ)。當(dāng)然,還可以用在有聲的錄制上。不過(guò),VALL?E 目前還沒(méi)開(kāi)源,要想試用可能還得再等等。作介紹這篇論文所有作者均自微軟,其中有三位共同作。一作 Chengyi Wang,南開(kāi)大學(xué)和微軟亞研院聯(lián)合培養(yǎng)博士生研究興趣是語(yǔ)音識(shí)別、語(yǔ)翻譯和語(yǔ)音預(yù)訓(xùn)練模型等共同一作 Sanyuan Chen,哈工大和微軟亞研院聯(lián)合培養(yǎng)博士生,究方向包括自監(jiān)督學(xué)習(xí)、NLP 和語(yǔ)音處理等。共同一作 Yu Wu,微軟亞研院 NLP 小組研究員,在北航獲得博士學(xué)位,究方向是語(yǔ)音處理、聊天器人系統(tǒng)和機(jī)器翻譯等。文地址:https://arxiv.org/abs/2301.02111音頻試聽(tīng)地址:https://valle-demo.github.io/參考鏈接:https://twitter.com/DrJimFan/status/1611397525541617665本文來(lái)自微信公眾號(hào):量位 (ID:QbitAI),作者:蕭?