Dementophiliac: 累積：資訊轟炸

戰爭是破壞，所以一般人都反戰；然而科技所帶來的‘創造性破壞’，卻是每個人都要面對的。90年代世界最重要的改變，既不是經濟金融，也不是政治軍事，而是大量資訊流通。這大概是自文藝復興以來，最顛覆傳統的突變，而這突變仍在持續演進。就像第一本印刷聖經出版時，根本沒有人能預料：1）天主教權威即將動搖，2）新科學即將誕生，3）歐洲的經濟與軍事即將稱霸世界，4）人類對教育兒童越來越重視，甚至視為理所當然，5）中產階級會取代貴族，更出現沒有皇室的國家。相同地，現代人生活幾乎不能沒有網路、手機、數位影像、音樂、視頻；加上各國政府擁有民眾資料，廣告公司蒐集消費動向，軍事反恐需要可靠的偵查情報，金融投資靠的是瞬息萬變的財經分析，飛機貨輪交通水電醫療快遞信用卡，全憑日理萬機的電腦系統24小時無休負責全球七十多億人口的一切事務。縱算有人排斥新科技，資訊時代也不會消失。正因為它如此重要，又有誰能預料，未來世界會出現什麼樣的改變？

當然，沒有電腦就沒有資訊時代；但是美國陸軍研究實驗室在1946年建造ENIAC計算機時，資訊業並沒有問世。就算到了60年代，太空總署為登月計劃而購買‘個人電腦’，或70年代日本開發電子計算機，美國Intel公司生產第一款八位元處理器，蘋果電腦開始銷售方便自用的電路板，國防工業設立最早的網路ARPANET，資訊仍不成氣候。80年代家用電腦逐漸有銷路，IBM佔領商業電腦市場，銀行業也爭相購買大型主機負責金融交易與數據處理；通訊業者開始有網路服務供應商，甲骨文公司(Oracle)成為世界最大的數據處理軟體業者，年收入僅次於微軟(Microsoft)；有人創制網路控制的國際標準(TCP/IP)，有人發明WWW（萬維網）的統一標識，連最早的網路病毒都亮相了，可是‘資訊’一詞實在還太抽象。這些發展固然奠定基礎，但對於非科技業的人，恐怕與目不識丁沒兩樣，更別說參與投入。

真正水到渠成的催化劑，是1993年改良的網頁瀏覽器。人是視覺動物，眼睛若看不到，就難以判斷事物的實用；可是一旦看到，網路立刻變成炙手可熱的媒體新產品。不久論壇出現，大家踴躍討論意見；青少年熱衷於線上日記或自做網頁；畢業生標榜網站經驗求職；公司怕競爭被淘汰而積極僱用網路工程師。電郵、網路新聞、即時通訊、網際通話、網路購物、社交網、線上游戲，都在短短幾年內變成許多人的每日需要。

而也在這期間出現兩種異動。第一種是對等網路(P2P)，也就是每個用戶都不需經過一般網站的中央服務，而是各自形成服務器，藉著整個群體交流信息，所以能取得文件卻不容易追踪。對於想保障隱私、盜版音樂電影的人，對等網路可說是無上福音；甚至後來的網路貨幣流通、網路黑市販毒，也是靠這種難以查詢的線上活動。首先遭新科技威脅的自然是娛樂業，之前高價賣的唱片，可能只有一首歌值得，很多人寧可從網路上抓，抵制唱片公司賺取暴利；音樂界想要打壓網路上的文件交換，卻難以斬草除根，而隨著電腦容量擴大、網路速度加快，連尚未播放的電視節目或剛殺青的電影，往往都在幾小時內成為年輕人惠而不費的娛樂，更有人說，網上哪有人花錢買色情？言下之意，免費就是網路帶給人最棒的福利。這看法道德與否不討論，‘資訊’的定義已涵蓋古往今來所有智慧產品。

第二種異動，是大量資料的蒐集堆積。谷歌(Google)和臉書(Facebook)都是代表。它們固然也提供其他服務，但他們最重要的收入來自廣告費；要廣告就得投其所好，知道每個用戶想買什麼；而要了解，就要先看個人電郵短訊、查詢消費習慣。對這些公司，收集資料並不困難，免費的背後，很多人已經習慣甚至樂意與人分享，舉凡珍藏幾十年的絕版書報，或是自己數位拍攝的照片，都逐一搬到網路上（就是所謂雲端）。既有資料，要查出一個人生日家庭、證件號碼、學校工作記錄、收入資產、犯罪前科、病歷服藥都可以，連吃什麼早餐、用什麼牙膏、聽什麼廣播的嗜好也清楚。一個人腦容量有限，頂多只能認識150人；但公司們要認識用戶，憑電腦大量記憶就夠了，可說天下無難事，只怕有心人。

然而堆積了這麼多資料，又代表了什麼？

*     *     *     *     *

中世紀煉金術認為，一個人包含水35公升，碳20公斤，氨4公升，石灰1.5公斤，磷800克，鹽250克，硝石100克，硫磺80克，氟7.5克，鐵5克，矽3克，其他少量元素十五種，但全部加在一起卻不能變成人。科技發達後，專家也開始實現人類基因組計劃，不過就算能解開每個基因的奧秘，加起來仍不等於一個人。同樣地，現在社會努力獲得個人資料，但難道這些資料本身就等於人？

我們對資訊要問的問題太多了。首先，資料可信麼？所謂盡信書不如無書，線上資訊只會更混亂。青少年為了不讓人知道自己在鬼祟什麼，很多報假名、改性別、亂填資料、謊稱成年；交友網站上的用戶，多半用修飾照片，有的謊報身高年齡三圍，有的不公開自己已婚，更沒有人直認有性侵記錄。有不少網站為了向投資人證明自己創辦成功，連假用戶也得濫竽充數。相反地，每家公司網上徵人，都習慣把履歷表中的花團錦簇打了折扣再評量。一般人讀了網頁上的訊息，會直覺地懷疑，因為可能是變相廣告，可能是惡意誣衊，可能是無名氏不負責任亂講，可能是無聊人故意找話題鬥嘴。真實世界通常要篩選資料，鑑別專家，否則債台高築的人談投資致富，報社連刊登都嫌對聲譽有累；但網路讓任何人都能自己當主編主播，於是狗皮膏藥也能吹噓為萬應靈丹；垃圾郵件更不在話下。甚至詐騙在科技輔助下，偽造身份易如反掌，也讓各國調查局難以追踪。

不過另一方面，資料誰在看？政府？保險業？行銷公司？非法集團？愛挖瘡疤的記者？喜歡三姑六婆的親屬？善妒的前妻？報復的男友？很多人太隨便與人分享資料，等到緋聞艷照曝光後才又哭說自己是受害者。沒有網路之前，明星偶像會有經紀人幫忙建立、保持形象；網路固然可以讓人一夕成名遍天下，但大部分人並不懂得如何培養或維護形象，結果把自己招牌砸爛了還懵然不知。這是個人魯莽，不提也罷。比較危險的是由於錯誤資訊而遭殃：有人無法開銀行戶頭，應聘也沒被錄用，甚至租房子都被刁難，只因某個同名同姓的刑事犯被逮捕時，政府人員把資料搞混；這種麻煩已不罕見，可惜如此細微的問題卻會讓無辜人一生受苦。更危險的是匪徒駭客專門鎖定某種資料，伺機竊取，畢竟‘金玉滿堂，莫之能守’，越值錢的資料就越有人下手。一家保險公司的電腦失竊，可能波及幾百萬人；一家大型連鎖店的顧客信用卡資料被盜，恐怕會使整個社損失上億。儘管密碼讓破解時間變長，解碼技術卻也每年進步，而最善於解碼的又莫過於網路駭客與情報機構。當然，世界各國政府都重視機密保管，但大家總是相互監聽，甚至對自己人民也防範猶恐不力。到最後資料越多，圍觀者也越多，然後人又擔心資料外洩而建築各樣防護牆，如此循環不息。

這樣講似乎危言聳聽，實際上資料價值為何？絕多數都是不值錢的。雖說人人平等，但許多人的生活實在枯燥乏味；單以一大堆社交網站所分享的照片來看，57%是食物，30%是自拍特寫，10%是自家寵物，毫無創意可言，甚至拍照幾萬張，連自己也沒翻過，更不知為何留念。假若有人認為手機可以讓人變成攝影藝術家，網頁能讓人變成文豪，線上書籍能讓人隨時進修，很抱歉，一般人並不是‘見賢思齊’的料，年輕人反倒爭相‘與下層看齊’。別人有刺青，自己也弄個刺青來拍照留念；當紅電影主角出口成‘髒’，線上視頻裡大家也髒話對喊。就算是正經內容，網路上仍有太多‘天下文章一大抄’，‘為賦新詞強說愁’，‘三過其門而不入’之類，要找值得的資料簡直是海底撈針。50年代有Sturgeon定律說：“90%的任何東西都是垃圾。”這是還沒有資訊劇增前的感慨，現在大概99.9999%的網路內容都是垃圾，即使儲存再多的資料也未必‘開卷有益’。舉例來講：假若國安局要尋找恐怖份子，因而搜索每個民眾的網路通話記錄，一億通電話也未必能獲得一分鐘的相關資料。不蒐集資訊，根本無法辦事；但蒐集了資料，有誰讀得完？就算讀完了，又有什麼意義？

換言之，沒有分析，再多的資料也是白費。可是這堆龐大的資料要靠電腦來分析也有不少問題，比方最基本的住址，沒有分項解讀，怎麼知道哪個是郵遞區號，哪個是公寓號碼？東亞記錄日期是用年月日排列，美國卻是月日年，而歐洲是日月年；其餘公制英制、攝氏華氏、成長率如何計算、價差以什麼為基準，諸如此類細節就讓人傷腦筋，單是整理出可用的資料格式已經要佔去大半時間。這才只是開頭。電腦系的人常說：“輸入垃圾，輸出也垃圾。”符合格式的數字未必合乎邏輯，一個人身高總不可能小於零，年齡總不會幾千歲；如此篩選適用的資料又會花不少手續。連數字都不易分析了，網路上浩瀚資訊幾乎以圖文居多，也沒有用戶愛填枯燥表格，怎麼辦？矽谷不少公司現在都在研究語義學(Semantics)，任何能將一串文字符號轉化為含義的軟體系統，自然能領先市場，獨占商機。然而語義並不是文法；就算句法結構符合規格，就算網路搜尋可以根據輸入而提供建議，這只是憑大部分字句組合的常用性猜測，與含義還相去甚遠。

坦白講，電腦網路記憶驚人，看似聰明，其實連五歲孩子能理解的事，電腦都做不到；它可以辨認指紋，可以立體模擬一張臉，甚至可以查出這人的身世背景，卻不能判斷他手上拿的盒子，是要給孩子的禮物。人工智慧專家Ray Kurzweil曾下定義：“能有目的地消除資訊，就是聰明的第一個表徵。”其實每個人眼睛每秒鐘也捕捉了許多資料，但人並沒有‘過目不忘’地記憶這些資料，而是抓到重點，然後把其他的刪掉；所以我們看到別人能直覺地認得是誰，倒是連自己父母孩子的五官都未必能正確形容——畢竟無誤地描繪一個人幫助不大，能知道對方是誰而適當溝通才更重要；記住別人的生日血型學校成績，益處還小，能在接觸中認知對方今天很累很忙很消沉，了解對方興奮什麼擔憂什麼生氣什麼，才是日常生活所需的‘本能’。也可以說，現在電腦還做不到人類的歸納整合推理判斷。它能搜索西洋棋下一步的所有可能性，但這僅限於有固定規則的環境；人類卻無時無刻地編出新準則、更改舊條例、剔除壞習慣。思考學習，就是為了不必去累積所有繁複的資訊：一個萬有引力公式可以取代幾千年的渾天儀記錄，一種病理研究可以解釋幾萬人的不明症狀，一句至理名言可以涵蓋幾百代的跌倒站起。當然，電腦軟體仍在持續進步，今日出現無人駕駛的汽車，十年二十年後照樣會日新月異；但資訊理論並不會改變——不簡化，就不算聰明。

可惜簡化的同時，人也不斷增加新資訊，而且增加的速度比整合歸納還快。今日很多人靠知識賺錢，即使是針對每家公司的業績利潤員工薪資產品反應，資訊都已經多如洪水；何況知識還衍生更多知識。舉例而言，市場競爭會促進產品改良，但怎麼改良、誰負責改良、何時開始改良、要多少預算、是否有產權專利問題、改良後如何評量、如何測試消費者滿意程度、若達不到預期要怎樣善後等等，都是之前沒有的資訊。越上層的經理董事，越需要面面俱到，也因此大家努力開會研討查資料問專家，唯恐一點疏忽，擔當不起責任。職場以外，人還是每天面對數不盡的資訊：有房子的人會閱讀稅金貸款的項目，有車子的人會注意維修保養的要訣，有孩子的人會著重師資校友的水準，有投資的人會擔心報酬風險的變動，有電腦的人會顧忌病毒隱私的問題，想購物的人在網上不是‘貨比三家’，而是‘貨比三十家，每家三十款’。在乎的事情多，要找的資訊也更多。就算不想碰資訊，資訊一樣隨著媒體廣告氾濫、親友口耳相傳；何況很多人吸收資訊已經上癮了，不查網路比不吃飯還難熬。但是人終歸受限於腦神經科學，攝取得多，能轉化為養分麼？或者徒然耗時耗力而已？

究竟資訊轟炸下，人類想學的是什麼？又是否真學到了呢？

        我們在資訊裡面失去的知識，到哪裡去了？
        我們在知識裡面失去的智慧，到哪裡去了？
                        ——艾略特(T. S. Eliot)，《磐石》，1934年

Dementophiliac

Wednesday, March 18, 2015

累積：資訊轟炸

No comments:

Blog Archive