網路資訊不斷爆炸性成長,每天都有數千萬則訊息在網上流通,數位資訊分析對品牌經營、產品規劃開始越趨重要,由台大技術轉移成立的新創公司藍星球科技目前正奮力朝向資料探勘(data mining)領域發展。總經理宋浩表示,新創公司就像是一張白紙,能夠給予其豐富色彩,雖具挑戰性、但有龐大成就感。

藍星球過去是隸屬於台大的學術研究團隊,負責執行數位典藏國家型科技計畫,當初目的是希望透過這項計畫把國家的博物館、圖書館、檔案館及美術館數位化,可望透過數位化方式放在網路給予社會大眾瀏覽。

宋浩表示,該計畫後來演變為把收藏品的文字敘述、尺寸及材質等利用自動化方式串聯到其他收藏品,好比連結方式,因此研究團隊在1997年在2012年之間做了許多自動化文字分析技術。

2012年該計畫宣告結束,當時後校方認為這樣的技術具有未來發展性,因此於是透過新創資金募資方式,期望將產品商業化,因此藍星球便在2013年正式成立。

宋浩表示,由於先前做的研究幾乎都是把檔案及書籍等做文字研究,相當文謅謅、獲利較為困難,因此後來公司開始朝向新聞媒體、社群網站的資料探勘方式著手,透過擷取重點、整理資料做成資料整理。

宋浩指出,這項資料蒐集工具可以用在品牌經營或產品優劣分析,舉例而言,客戶可以透過客製化方式獲得新聞對產品評論,或是網友產品使用上的優劣,進而改善產品品質。

宋浩舉例,若是汽車客戶推出一款新車,可以透過這套系統蒐集網友對汽車的使用心得,好比部落客開箱文,或是在網路論壇的網友發表文章認為駕駛體驗不錯,甚或是方向盤太重等,好讓品牌商可以不用再透過過去以實體問卷模式蒐集產品使用體驗,使資料輿情蒐集更具效率。

藍星球所跨入文字分析領域,競爭者相當多,不過藍星球以自行研發的斷句分析模式打下一片天。宋浩表示,台灣不少業者在做相關的輿情分析及文字分析,中國大陸有更多類似同業,不過目前大多數業者做的都是自然語言處理(NLP),雖然能達到語言理解,但很可能無法把無效文章或文字給過濾掉。

舉例而言,過去以NLP模式開發的產品,常常會在文章中看到整理出的重點關鍵字是「你」、「我」、「他」,但這些文字在中文字中絕對常常會出現。

因此藍星球在中文斷詞上花了很大一番功夫,宋浩指出,以停電新聞舉例,「全台大停電」在斷字處理上就可以做出「全台,大停電」或是「全,台大,停電」等各種語意,不同斷句就會有不同結果,因此藍星球特別針對中文斷句做了相當大的研究功夫。

藍星球即便在這激烈競爭環境下,到目前仍在穩定獲利,且宋浩指出,目標是在數年後將公司推向公開發行,以及上市櫃的目標,讓公司能夠被更多人看見。

宋浩頂著台大資工所博士班畢業的光環,並沒有選擇相對穩定的國際級科技產公司就職,選擇面對充滿挑戰性的新創公司。他表示,進去Google之類的大公司雖然能夠賺取財富,但是爬上管理階層就相對難上許多,新創公司就像是一張白紙,能夠給予其豐富色彩且帶領公司成長,雖然冒險但富有成就感,選擇新創公司不見得是件壞事。

達人小檔案

現 職:藍星球總經理

出  生:1981年

學  歷:文化大學資管系

輔大資工所碩士

台大資工所博士

經  歷:台大講師

趨勢科技工程師

興  趣:健身、慢跑

達人座右銘

挑戰越大

成就感越高

#台大