IBM喜歡大數據,獲取的越多,就越能向用戶銷售出更多的服務器、存儲和服務。但是由于IBM獲取的大數據容量已經過大,導致這家公司的研發人員很難駕馭這些數據。
舉例來說,IBM位于硅谷阿爾馬登研究中心的專家勞拉·哈斯(Laura Haas)去年就曾詢問同事,她為什么不能使用更大的數據集。哈斯當時就曾表示,單是準備數據就花費了他80%的時間。
台北經絡按摩 哈斯意識到,IBM研究時間被數據分析耗費的越多,該公司的專家就會耗費更多的時間和精力用于擴展數據集,從而放緩研發的步伐。
很明顯,這種事情應當交付給專業的數據科學家來解決,但是這樣的循環只能讓情況變得更加糟糕。還有,它似乎有悖于大數據的常規,因為依據存儲能力的擴展或是傳感器成本的下滑,大數據的價值并不受摩爾法則或是克來德法則(Kryder's Law,每10.5年硬盤驅動器的信息密度就要增長1000倍,也就是說,每13個月存儲密度就要翻一番)支配。
當然,大數據更適用于“麥特卡夫定律” (Metcalfe's Law)。該定律指出,網絡的價值等于網絡用戶數的平方數;增加網絡和其他通訊技術的接入用戶數量,將獲得巨大效益。 對IBM的研發人員而言,情況也確實如此。為解決這一問題,IBM硅谷阿爾馬登研究中心在去年秋季推出了“加速發現實驗室”(Accelerated Discovery Lab)。
高雄老人看護 這個實驗室有著非常大、開放的空間,能夠裝配舒適的家具、白板以及許多的屏幕,更別提循環參與的項目團隊、系統管理員、訪問客戶、人類學家和IBM Watson超級計算機。正如這個實驗室的名稱所暗示的那樣,它的目標是使用多元化、鄰近、物理空間的最優組合破解代碼。
目前擔任該實驗室技術和運營總監的哈斯對此表示,“我們把它稱為哺育‘戰略意外發現。’這就如同是在淋浴時或飲水機旁找到靈感一樣。我們希望把人們聚集在足夠寬闊的環境中,讓他們享受于此。通過利用房間的連接,數據的連接以及能夠掌握用戶正在做什么的能力,培育意外發現。”
加速發現實驗室的第一個項目是利用Watson超級計算機在新領域的自然語言處理能力,藥物研究則是首選。通過與貝勒醫學院計算機生物學家的合作,IBM的數據科學家開始在數以百萬計的論文、專利和臨床研究中采集數據,并最終把他們的注意力集中在了腦腫瘤抑制基因TP-53上。在幾個月之內,研發團隊就找到了四個候選產品。“加速發現實驗室”展露額和項目開發總監杰夫·威爾瑟(Jeff Welser)表示,“通常找到一個產品就需要約一年的時間。”
這個速度確實已相當快,但能否更快一點?
台北搬家公司 該實驗室的使命之一,便是對自有空間的研究假設。哈斯表示,“我們當前嘗試在項目開始就記錄下來,看看這些白板和顯示屏能否會獲得明顯的成效。”
雖然IBM當前還沒有計劃在其它研發中心建造類似的實驗室,但是哈斯希望有朝一日能夠開發出一款軟件工具,幫助公司管理自有資源。