NEC日前宣佈,運用人工智慧(AI)發現混雜於巨量資料中複數規則的「異種混合機械學習」技術(註1)為基礎,開發出更為強化的「分散版異種混合機械學習」技術,這項技術能從超大規模資料中,以分散的運算系統產生預測模型。
所謂的「異種混合機械學習」,是藉由巨量資料的分析與預測,再加上星期幾、天氣如何等條件,自動發現其中「資料的狀況分類」與「變數(註2)的組合」的技術。
過往,資料的範例數量達到數千萬件以上、大於一台電腦搭載記憶體容量的超大規模資料,要將其進行分析時,會另外再將資料分割後進行分析。另外,即使搭載高性能CPU(核心數增加等狀況)也有所極限,因此該如何改善大規模的資料分析效能,就是目前面臨的課題。
這次NEC所開發的技術「分散版異種混合機械學習」,是讓分散開來的不同電腦,各自進行異種混合機械學習的分析時,能夠同時將全體整合起來,只要增加電腦數量,龐大的資料也能不受限制的產生預測模型。舉例來說,大型金融機構的結餘預測,或是大型電信業者的客戶解約數量預測,像這樣有數千萬件相關事例的超大規模資料,也能運用這次的新技術來進行分析。
由新技術來進行實證實驗(註3)的結果,與舊技術相比,AI的學習速度約提昇為原本的110倍(註4),預測精準度(註5)也提昇了17%。
NEC針對本技術會持續更進一步開發研究,目標在2018年3月將技術實用化。
背景
針對巨量資料迅速進行分析,在預測未來情形時也有所幫助,現在對如此技術的期待日益提昇。NEC至今都持續獨家開發並強化「異種混合機械學習」,這項AI技術能夠高度精確地進行巨量資料分析。(註1) 透過「異種混合機械學習」技術,使資源可以有效運用,包含能源、水、食材的需求預測,為提昇物流管理效率的庫存需求預測,強化零售店舖管理的商品需求預測等情形,都能進行高精準度且大規模的預測。 另一方面,「異種混合機械學習」技術發展到現階段,在運用超大規模資料學習時,會受到電腦記憶體容量、CPU 核心數限制等性能上的侷限,是目前面臨的課題。 新技術的特長如下所述。 新技術的特長
1. 開發出可適用於分散運算系統的演算法(手法)
2.
開發出可在分散運算基礎Apache Spark上運行的軟體 另外,NEC將在美國的Spark Summit 2016(6/6~6/8於美國舊金山,註7)的6/8場次,以及Hadoop
Summit San Jose 2016(6/28~6/30於美國聖荷西,註8)的6/30場次,發表本技術相關內容。 (註1) 2014年7月29日NEC強化「異種混合機械學習技術」 發現巨量資料中的複數規則 (註3)將資料分割後也能適用於先前的異種混合機械學習技術。實驗內容為運用2000萬筆餘額資料事例來預測ATM的現金餘額。 (註4)分析資料以1000萬筆事例的情形進行比較,總CPU核心數以128倍計算。 (註5)預測值與實際值的誤差。 (註6)美國加州大學柏克萊分校所開發的開源叢集運算框架。 (註7)關於Apache Spark最知名的技術大會之一。2016的大會相關資訊請參考:https://spark-summit.org/2016/events/distributed-heterogeneous-mixture-learning-on-spark/ (註8) 關於Apache Spark最知名的技術大會之一。相關資訊請參考:
|
首頁|手機版|Chip123 科技應用創新平台 |新契機國際商機整合股份有限公司
GMT+8, 2025-1-23 04:49 AM , Processed in 0.093600 second(s), 16 queries .
Powered by Discuz! X3.2
© 2001-2013 Comsenz Inc.