亚洲一区精品自拍_2021年国内精品久久_男同十八禁gv在线观看_免费观看a级性爱黄片

當前位置:文章中心>新聞快遞
公告通知 新聞快遞 技術教程 產品展示

合成數(shù)據能讓人工智能變得更好嗎?

發(fā)布時間:2022-06-14 點擊數(shù):955
盡管人工智能 (AI) 由于指數(shù)級的發(fā)展而變得更加先進,但這種現(xiàn)代技術的局限性仍然存在。

盡管人工智能 (AI) 由于指數(shù)級的發(fā)展而變得更加先進,但這種現(xiàn)代技術的局限性仍然存在。

那么,合成數(shù)據能否成為所有與人工智能相關的問題的解決方案?

在第四次工業(yè)革命中,每個行業(yè)都發(fā)現(xiàn)了現(xiàn)代技術的潛力;比如人工智能(AI)和機器學習(ML)。

幾乎所有其他組織都在部署 AI 以創(chuàng)建更高效的業(yè)務流程并確保更好的客戶滿意度。但是,初創(chuàng)公司、SOHO 和中小型企業(yè) (SMB) 在采用 AI 時面臨一個重大問題——這就是所謂的 冷啟動問題。雖然初創(chuàng)公司和中小企業(yè)一般沒有資源收集大數(shù)據,但冷啟動問題基本上是缺乏此類相關數(shù)據。

另一方面,行業(yè)巨頭已經擁有資源來收集真實世界的數(shù)據并將這些數(shù)據應用于訓練他們的人工智能系統(tǒng)。因此,對中小型企業(yè)的勝算很大。在這種情況下,合成數(shù)據可能是必要的啟動器。

合成數(shù)據可以成為數(shù)據驅動的商業(yè)模式背后的驅動力。此外,研究表明 合成數(shù)據產生與真實數(shù)據相同的結果。 與真實數(shù)據相比,合成數(shù)據被認為更便宜且處理時間更短。因此,合成數(shù)據的出現(xiàn)可以平衡目前由大公司主導的競爭環(huán)境,有利于中小企業(yè)和初創(chuàng)公司。

發(fā)現(xiàn)合成數(shù)據的好處

合成數(shù)據是基于用戶指定參數(shù)的計算機生成的人工數(shù)據,以確保數(shù)據盡可能接近真實世界的歷史數(shù)據。通常,Unreal 引擎和 Unity 等游戲引擎通常用作模擬環(huán)境,用于測試和訓練基于 AI 的應用,例如自動駕駛汽車?;诤铣蓴?shù)據開發(fā)人工智能驅動的應用程序有很多優(yōu)勢。其中一些優(yōu)勢包括:

合成數(shù)據能讓人工智能變得更好嗎?

1.開發(fā)原型

查找、聚合和建模大量相關的真實數(shù)據是一個乏味的過程。因此,生成合成數(shù)據可能是最佳解決方案。此類數(shù)據將能夠在大規(guī)模生產之前構建原型并測試此類原型以獲得所需的結果。與真實數(shù)據相比,使用合成數(shù)據構建原型更高效、更具成本效益。

非營利性人工智能研究公司 Open AI 正在開發(fā)大量基于人工智能的應用。在這些應用中,研究人員開發(fā)了用合成數(shù)據訓練的機器人,可以在看到一個動作只執(zhí)行一次后學習一項新任務。一家美國加州科技初創(chuàng)公司正在開發(fā)一個人工智能平臺,其愿景類似于 Amazon Go。這家初創(chuàng)公司旨在借助合成數(shù)據為便利店和零售商提供免結賬解決方案。他們還引入了人工智能驅動的智能系統(tǒng)來監(jiān)控商店中的每一位購物者,以識別和分析他們的學習模式。

2. 確保數(shù)據隱私

2018 年 11 月,  5 億萬豪客戶在一次備受矚目的數(shù)據泄露事件中受到影響。在這 5 億人中,有 3.27 億用戶的護照信息、電子郵件地址、郵寄地址和信用卡信息等數(shù)據被盜。由于此類事件,人們擔心其數(shù)據的安全性和隱私性。

合成數(shù)據可以有效地解決此類隱私問題。合成數(shù)據不包括任何個人數(shù)據。因此,可以輕松確保數(shù)據隱私。合成數(shù)據在為醫(yī)療保健應用訓練 AI 系統(tǒng)方面非常有用。人工智能系統(tǒng)通常需要真實的患者數(shù)據。這威脅到患者的隱私。合成數(shù)據允許在醫(yī)療保健領域開發(fā)先進的人工智能應用程序,同時保持患者的機密性。

例如,來自 Nvidia 的研究人員正在與明尼蘇達州的 Mayo Clinic 以及波士頓的 MGH 和 BWH 臨床數(shù)據科學中心合作,正在 使用生成對抗網絡來生成用于訓練神經網絡的合成數(shù)據。 生成的合成數(shù)據包含來自阿爾茨海默病神經影像學倡議數(shù)據集的 3,400 個 MRI 和來自多模態(tài)腦腫瘤圖像分割基準數(shù)據集的 200 個 4D 腦 MRI 和腫瘤。同樣,模擬 X 射線也可以與實際 X 射線一起使用,以訓練 AI 系統(tǒng)識別多種健康狀況。

3. 前所未有的場景測試和訓練

開發(fā) AI 驅動的應用最重要的過程之一是測試系統(tǒng)性能。如果系統(tǒng)沒有產生所需的輸出,則需要對其進行重新訓練。在這種情況下,合成數(shù)據可以證明是有益的。合成數(shù)據可以生成場景來測試 AI 系統(tǒng),而不是使用真實數(shù)據或在真實環(huán)境中測試系統(tǒng)。這種方法比獲取真實數(shù)據便宜且耗時更少。

同樣,合成數(shù)據還可以針對未來可能出現(xiàn)的缺乏真實數(shù)據或事件的場景訓練新的或現(xiàn)有的系統(tǒng)。通過這種方法,研究人員可以開發(fā)更具未來感的人工智能應用。此外,使用合成數(shù)據重新訓練 AI 系統(tǒng)更簡單,因為生成合成數(shù)據比收集準確的真實數(shù)據要簡單。

由于這些好處,合成數(shù)據已成為測試和訓練自動駕駛汽車的一種可訪問的替代方案。許多自動駕駛汽車開發(fā)人員正在使用 GTA V 等模擬游戲環(huán)境來訓練他們的基于人工智能的系統(tǒng)。同樣,May Mobility 正在通過使用合成數(shù)據訓練他們的車輛來構建自動駕駛微型交通服務。

另一家名為 Waymo 的自動駕駛汽車開發(fā)商已經通過在模擬道路上行駛 50 億英里和在真實道路上再行駛 800 萬英里來測試其自動駕駛汽車。合成數(shù)據方法允許開發(fā)人員在模擬道路上測試他們的自動駕駛汽車,這比在實際道路上直接測試要安全得多。

4. 提高數(shù)據靈活性

獲取真實數(shù)據是一個乏味的過程,包括支付注釋費用并確保避免任何侵犯版權的行為。此外,真實數(shù)據只能用于在特定領域具有足夠歷史數(shù)據的特定場景。與真實數(shù)據不同,合成數(shù)據可以立即呈現(xiàn)對象、場景、事件和人員的任意組合。合成數(shù)據可以生成能夠發(fā)現(xiàn)利基應用的通用數(shù)據集。因此,研究人員可以利用合成數(shù)據探索無限的可能性。幾家初創(chuàng)公司 通過開發(fā)滿足客戶要求的訓練數(shù)據集, 創(chuàng)造了開放的數(shù)據經濟。

5. 探索合成數(shù)據的局限性

盡管合成數(shù)據可以幫助 AI 到達未被發(fā)現(xiàn)的領域,但其局限性可能成為其主流部署的主要障礙。對于初學者來說,合成數(shù)據模擬了真實世界數(shù)據的多個屬性,但它不會完全復制原始數(shù)據。 在對此類合成數(shù)據進行建模時,人工智能系統(tǒng)只會在真實數(shù)據中尋找共同的趨勢和情況。因此,現(xiàn)實世界數(shù)據中極端案例中包含的罕見場景可能永遠不會包含在合成數(shù)據中。 

此外,研究人員尚未開發(fā)出一種機制來檢查數(shù)據是否準確。發(fā)現(xiàn)真實數(shù)據中的缺陷并減少它們比使用合成數(shù)據更簡單。人工智能驅動的系統(tǒng)已經有 陰暗面 這會助長無意的偏見。使用合成數(shù)據,預測這種偏見的范圍和影響可能還為時過早。

6. 克服挑戰(zhàn)

企業(yè)組織需要了解合成數(shù)據是一個相當新的發(fā)現(xiàn)。此類數(shù)據的效率和準確性尚未根據當前的行業(yè)標準進行評估。因此,合成數(shù)據不應被視為獨立的數(shù)據源。尤其是在面臨安全問題的應用中,例如醫(yī)療保健應用和自動駕駛汽車,合成數(shù)據必須與現(xiàn)實世界數(shù)據相結合,以開發(fā) AI 系統(tǒng)。但零售業(yè)的應用具有較低的風險因素,很容易依賴合成數(shù)據。

出于測試目的,合成數(shù)據是一種可行且成本低廉的解決方案。但是,出于其他目的,在采用合成數(shù)據作為獨立解決方案之前,需要徹底研究和分析人工智能系統(tǒng)的結果。隨著進一步的研究,合成數(shù)據對于多種操作可能會變得更加可靠。