學術前沿
大數據促進科學與人文融合

發布時間:2018-09-12 | 信息來源:江蘇省哲學社會科學界聯合會

 以數理化為代表的科學文化和以文史哲為代表的人文文化,是當前文化的兩種主要形式,被稱為“兩種文化”。最早從學理上將文化分為科學文化和人文文化,并注意到它們之間分裂現象的是英國學者斯諾(C. P. Snow),他于1959年在劍橋大學發表《兩種文化與科學革命》《再論兩種文化》等演講,并以《兩種文化》為題結集出版后引發了科學文化與人文文化及其分裂現象的廣泛討論,并將兩種文化及其分裂問題稱為“斯諾問題”。隨后,世界各國的諸多學者紛紛開出彌合兩種文化的各種藥方,其中包括斯諾本人提出的教育改革和科學普及的方案,但兩種文化還是沒有找到融合的根本途徑。

 人文學科難以數字化

 兩種文化之所以難以融合,主要是因為它們建立在不同的方法論平臺之上。自然科學之所以能夠一路高歌,主要由于其主體間性、可解釋性、可預測性、可檢驗性等,而人文學科則通常缺少這些特征。自然科學的這些特征建立于經驗化、數據化和邏輯化的基礎上,不同自然科學學科之間雖然存在不同研究視角,但基本都建立在觀察、實驗的基礎上,通過觀察、實驗獲取數據,通過數據找出其因果性或相關性規律,即自然科學“用數據說話”。這些數據可觀察、可檢驗、可解釋、可預測,不因人而異。反觀各人文學科,較為注重個人體驗,其主要方法為體悟、思辨等,多建立于個人假設基礎上,用思辨的方法建構具有個性化的思想理論體系。人文學科由于缺少具有客觀性的數據,從而無法用數據說話,造成因人而異、各說一辭的局面,主體間很難取得共識。因為建立在不同的方法論平臺上,科學文化與人文文化間分裂為兩個對立的共同體,相互之間基本不可通約,各種融合方案多以失敗告終。

 人文學科為什么不向自然科學學習,也通過數據化手段來“讓數據說話”?這主要是自然科學與人文學科的研究對象不同而使用不同的方法,從而造成人文學科很難用自然科學的方法取得相關數據。

 自然科學研究的是自然的各種現象及其規律,自笛卡爾以來,作為主體的研究者與作為客體的研究對象間拉開了距離,人可以對研究對象進行孤立、靜止的客觀性觀察,甚至按照研究目的對研究對象進行受控實驗,通過觀察和受控實驗獲取研究對象的輸入—輸出數據,并根據這些數據建構數學模型來刻畫、模擬研究對象,由此發現研究對象的內在規律。

 但是,人文學科的研究對象是人類自己,而人具有自我意識和主體性,研究者和研究對象都是人本身,我們很難像研究自然現象一樣對人進行觀察、實驗。這樣,我們很難獲取刻畫人類的客觀數據,因此人文學科也就很難用數據說話,只能通過猜想、假設和推理的方法進行思辨性的研究。

  大數據成為社會科學新工具

 雖然人文學科很難用數據說話,但以人類群體為研究對象的經濟學、社會學、法學等社會科學,常模仿、借鑒自然科學的方法,試圖用數據說話,這或許能夠成為人文文化與科學文化間的紐帶。

 不過,傳統社會科學還難以擔當紐帶的重任,因為它依靠訪談、抽樣等方法得到的數據有時很難反映對象的真實狀態。自然科學的研究對象多呈線性或類線性關系,通過少量關鍵數據便能夠刻畫對象間的關系和規律,而社會科學的研究對象復雜多變,訪談、抽樣所獲的少量數據不足以刻畫對象間復雜、多變的關系,因此很難通過少量數據反映人類及其社會規律。由此可見,數據采集技術的落后是限制社會科學走向客觀化、科學化的主要因素,并導致了社會科學無法像自然科學一樣“用數據說話”。社會科學正在等待像自然科學的“望遠鏡”“顯微鏡”那樣的數據采集新工具。

 隨著信息科學技術的發展,特別是計算機、互聯網、云計算、人工智能等技術的快速發展,人類正逐漸走向大數據時代。隨著大數據時代的來臨,社會科學迎來了數據采集的革命性新工具,并進入了與自然科學共享方法論平臺的新時代。大數據革命讓社會科學的數據采集進入智能化、自動化時代,并帶來了客觀、精準、在線的海量數據,讓社會科學與自然科學一樣,能夠實現“讓數據說話”。

 1.大數據發展帶來數據的海量化。大數據技術將萬物數據化,不但能夠把自然世界數據化,而且還能將人類行為以數據形式記錄下來,形成數據軌跡。大數據技術還能將傳統社會科學難以數據化的文檔、語音、影像、圖片、方位、心理、生理等研究對象都轉化為可存儲、可計算的數據,并通過網絡匯聚到云端,形成與自然、社會相映射的數據世界。因此,社會科學在大數據的支持下變成了數據密集型的計算社會科學。

 2.大數據發展帶來數據的客觀化。在大數據時代,從數據采集者視角來看,數據主要依靠智能感知、網絡存儲等自動生成,不再依賴某個具體的采集者,因此大數據是無主體的數據,從而具有主體間性。從被采集者視角來看,大數據基本上是在人們不知不覺的情況下智能、自動生成的數據軌跡,因此不會被采集對象的情緒、態度等主觀因素干擾。由此,常被人詬病的社會科學數據污染問題在大數據時代被數據的智能、自動采集所解決。

 3.大數據發展帶來數據的精準化。傳統的訪談、抽樣所采集的少量數據很難刻畫由人的主體性而帶來的社會科學的復雜性,只能是“盲人摸象”式的以偏概全。但是,大數據技術所帶來的海量數據則將人類的舉止言談一網打盡,每個細節都留下了數據軌跡,或者說大數據像“上帝之眼”一樣全面記錄每個人每時每刻的言行,用“高像素、高分辨率”的海量數據精準刻畫人類的方方面面,這樣每個人都有了詳細的生活細節,數據精準刻畫了每個人的一切。

 4.大數據發展帶來數據的在線化。大數據時代的數據皆以分布參數的形式儲存于網絡、云端,隨時能夠被挖掘和計算,因此世界的歷史成為了在線的活歷史,歷史事實隨時可以被復原和解讀。在數據世界里,數據打通了萬物的在場與不在場、此在與彼在,也聯通了過去、現在與未來,一切都以在線的形式存在。數據的在線化為社會科學的研究提供了豐富、鮮活的材料。

   

  社會科學數據化

 成為科學與人文融合紐帶

 大數據技術對自然世界及人類思想、行為的數據化,將自然、社會和人類思維映射為一個由數據構成的數據世界,無論是自然科學還是社會科學,其實質都是對數據的挖掘、計算和預測。大數據精準刻畫了人類行為,精細地記錄了我們每一個歷史瞬間,因此大數據將成為對人類行為科學描述的新工具,讓社會科學能夠像自然科學一樣客觀記錄和描述人類行為。自然科學通過觀察或受控實驗所獲取的數據尋找自然規律,而社會科學有了大數據同樣可以獲取客觀、真實、精準的數據,并通過挖掘經驗數據,發現數據間的相關關系,尋找蘊藏其中的社會規律,因此社會科學與自然科學一樣可以用數據的形式表征其規律,并實現算法化。更為重要的是,數據化和算法化之后,可以通過數據計算的方式實現對人類行為進行精準預測,人的未來行為會像自然現象一樣可分析、計算和預測。

 綜上所述,社會科學與自然科學雖然研究對象、復雜程度不同,但在大數據時代皆可以被數據化,并通過大數據來進行精準描述、計算和認知。從科學方法論角度看,它們已經建立在統一的數據密集型方法論平臺上,從而實現了社會科學的可表征、可計算和可檢驗,長期以來被人詬病的社會科學的不可計算性和不可檢驗性得以克服。一旦被數據化,那么社會科學也就可以建立數據模型,并進行計算、推理等數學和邏輯操作,滿足邏輯實證主義的經驗化、邏輯化、數學化的要求,從而也走向科學化,由此獲得了與自然科學對話的基礎。

 當然,并不是說社會科學要完全改變原來的研究路徑,走向自然科學化道路,恰恰相反,社會科學仍然保持著自身特色。因為大數據技術能夠對原來難以數據化的符號、聲音、心理等參數進行數據化,傳統社會科學也將自動納入數據化的平臺。由于大數據的興起,社會科學可以作為人文文化和科學文化的紐帶,通過大數據方法論平臺使兩種文化進行交流、融合。

(來源:中國社會科學網  作者:黃欣榮 沈秋蓮 工作單位:江西財經大學馬克思主義學院


關注我們

江蘇省哲學社會科學界聯合會社科聯微信

江蘇省哲學社會科學界聯合會社科聯微博

收藏 微信公眾號 官方微博
世界杯哪里可以押注