百度股市通如何實現智能選股?
百度股市通是百度大數據業務進入金融領域的開始,它為百度在互聯網金融上補齊了“信息”這一環,百度在自然語言處理、深度學習上的基礎技術是這款選股助手的基礎。
大數據應用在金融行業是老生常談,最被人們津津樂道的是“海量Twitter信息中的情緒狀態指標與道瓊斯工業標準指數之間存在聯動關系”,這來自于印第安納大學計算機科學家Johan Bollen的一個報告,尚在學術研究層面。這方面一直缺乏商業化應用,而百度自去年開放大數據引擎,已經在多個領域進行了大數據的應用和嘗試,尤其是去年世界杯期間,百度大數據對淘汰賽的比賽結果預測正確率達到94%,領先微軟、谷歌和高盛。目前,百度基于大數據應用又發布了一款最新的手機股票軟件“百度股市通”,通過其獨創的股市知識圖譜,可以為股民提供最新股票熱點信息幫助用戶發現這些信息與股票的關系。
當股市遭遇互聯網大數據
百度股市通定位為股民選股的輔助工具,尤其是彌補了市面上股票軟件在消息實時性、全面性、關聯性和智能性上的不足。它的核心思路是利用大數據,聚合有價值的新聞信息和用戶數據、尋找股票與消息、股票與股票之間的關聯,并且整合第三方的專業金融數據,給股民最有價值的信息。
百度搜索每天會接到數億條政經相關的搜索請求,以及百度新聞每天收錄的數百萬條資訊,這都是百度天然的大數據優勢。還有全球股市的交易行情,這部分各家都有,只要做到及時準確就可以了。從產品試用來看,百度應該有從證券機構獲取專業的研報、公告等,比如在某個個股信息里,“百度股市通”有專門的“研報”類別,會顯示所有機構對該股票的評級。百度股市通把這些數據挖掘后再聚合的方式進行呈現。
當然,百度的大數據顯然不止這點作用,百度股市通還將海量數據與2000多只A股股票關聯起來,同時將不同股票關聯起來,發掘熱點信息與個股的關系,某個熱點事件可能會影響哪些股票,這就是其產品的核心功能“智能選股”。
距離預測股價還很遙遠,做選股助手同樣實用
成功預測股價有著巨大的商業價值,但世界上還沒有任何個人、機構、技術或者產品可以百分之百地準確預測股價。股票價格受到諸多因素影響,短期主要是消息,消息引發股民決策進而形成一輪博弈,博弈結果是股價;長期則是企業本身價值與投資者期望值之間的契合度。
而股價是“人為因素決定”,傳統的金融學是建立在隨機行走和有效市場假說的基礎之上,在有效市場假說理論中股價的變動很大程度取決于消息(新聞),市場上新信息的出現不可預測。這與天氣這類有規律可循的自然現象不同,但在分析原理上也有類似可參考的部分。早期的天氣預測主要依靠經驗來判斷,準確率很低,隨著科技發展,人們發明了越來越多的氣象儀器,現在的天氣預測會根據氣象衛星發回的云圖和氣象站測得溫度、氣壓、風向、風速等數據來列出相應的方程組進行分析判斷,這里同樣也是大數據的應用,而由于方程組是非線性的,一點點的誤差就有可能造成結果的巨大區別。因此理論上來說,任何預測都不可能是100%準確的。百度股市通聰明的地方就是并不預測股票的漲跌(這也是證監會禁止的),只是預測熱點事件的發展走勢,并將熱點事件相關聯的股票提供給用戶,至于最終的投資決策還是由用戶自己決定。
市面上已有大智慧等炒股工具,但它主要是交易和數據系統,順帶提供了少許資訊,沒有大數據應用,在實時性、關聯性上存在短板。另外雪球財經這類App在個股信息和討論上做得很好,在熱點事件、股票關聯上也沒有對應的大數據產品。百度股市通是市面上唯一基于大數據提供智能選股服務的股票軟件。
股市知識圖譜是百度股市通基礎,進入門檻高
在百度股市通之前,已經有基于大數據的選股協助工具,不過只停留在“指數”層面,騰訊曾在2013年聯合專業金融機構推出“騰安價值100指數”,去年百度也聯合中證指數公司和廣發基金發布“百發100”互聯網金融指數。全球知名指數都是媒體發布的,隨著互聯網金融發展,互聯網媒體在資訊聚合能力和信息發布渠道上的優勢都在得到體現。百度是“媒體之上的媒體”,做指數也不足為奇。
但是百度股市通與指數有非常大的不同。指數只是把股票市場整體趨勢量化,百度股市通更多體現在“個性化”上,比如根據熱點事件命中“事件影響股”,再根據用戶訂閱推送關聯消息。另外百度股市通可以直接呈現熱點消息和第三方專業數據,幫助用戶在縱橫交錯的海量信息中找到與股票相關的最新信息。
指數和百度股市通都是基于大數據,但百度股市通還多了一層,即知識圖譜。知識圖譜的要義就是找到不同信息的關聯性,形成一個網狀的知識結構,所謂圖譜。而股市知識圖譜就是建立起各類數據、信息與股票的關系,以及股票與股票之間的關系,所以可以第一時間通過各種信息的熱度變化來分析股票未來可能的走勢。百度的股市知識圖譜在數據上有優勢,在技術上也有特長,百度在搜索結果頁中早已整合了知識圖譜便于用戶進行二次搜索。知識圖譜技術核心是自然語言處理和深度學習技術的數據挖掘,這是百度擅長的。海量信息關聯性靠人工來梳理不現實,耗時耗力無法滿足實時性需求,基于深度學習技術,百度股市知識圖譜本身可以實時迭代,模型本身也在不斷更新。因此,指數產品CCTV、騰訊等媒體都可以做,但股市知識圖譜只有搜索引擎公司才可以做,這也是百度股市通實現“智能選股”的關鍵所在。
百度股市通對于百度的價值在哪里?大數據商業化和互聯網金融
百度股市通只是百度眾多大數據產品中的一個。2014年開始百度已陸續推出流感預測、景點預測、商圈熱力圖、世界杯預測等基于大數據的產品。股市通是百度在大數據商業化上的又一個新產品,并且首次涉足證券領域,證券與大數據有天然關聯性,結合點正在越來越多。
另外值得注意的是互聯網金融已是百度非常重要的新業務方向。百度要做O2O就必須大力發展百度錢包這一互聯網金融工具,二是百度本身是一個流量和營銷入口,因此與基金合作推出百發、百賺、沃百富以及面向企業的小貸產品,是其這兩年重點做的事情。做“百度股市通”在信息數據層面進一步完善了百度互聯網金融的版圖,這是其所擅長,也有商業價值,比如未來做個性化收費版本、可以成為百度互聯網金融產品的銷售渠道、甚至百度也有可能自己做一家證券機構,直接為股民提供全方位的服務。
可以看到百度股市通整合了不少傳統金融機構的數據和服務,比如合作券商核心操盤內參等等,未來不排除會引入專業的操盤手或者分析師進入給股民做咨詢服務。這也迎合了百度要“連接人與服務”的趨勢。
小結一下:百度股市通是百度大數據業務進入金融領域的開始,它為百度在互聯網金融上補齊了“信息”這一環,百度在自然語言處理、深度學習上的基礎技術是這款選股助手的基礎。