Wednesday, March 18, 2015

累積:資訊轟炸


戰爭是破壞,所以一般人都反戰;然而科技所帶來的‘創造性破壞’,卻是每個人都要面對的。90年代世界最重要的改變,既不是經濟金融,也不是政治軍事,而是大量資訊流通。這大概是自文藝復興以來,最顛覆傳統的突變,而這突變仍在持續演進。就像第一本印刷聖經出版時,根本沒有人能預料:1)天主教權威即將動搖,2)新科學即將誕生,3)歐洲的經濟與軍事即將稱霸世界,4)人類對教育兒童越來越重視,甚至視為理所當然,5)中產階級會取代貴族,更出現沒有皇室的國家。相同地,現代人生活幾乎不能沒有網路手機、數位影像音樂視頻;加上各國政府擁有民眾資料,廣告公司蒐集消費動向,軍事反恐需要可靠的偵查情報,金融投資靠的是瞬息萬變的財經分析,飛機貨輪交通水電醫療快遞信用卡,全憑日理萬機的電腦系統24小時無休負責全球七十多億人口的一切事務。縱算有人排斥新科技,資訊時代也不會消失。正因為它如此重要,又有誰能預料,未來世界會出現什麼樣的改變?

當然,沒有電腦就沒有資訊時代;但是美國陸軍研究實驗室在1946年建造ENIAC計算機時,資訊業並沒有問世。就算到了60年代,太空總署為登月計劃而購買‘個人電腦’,或70年代日本開發電子計算機,美國Intel公司生產第一款八位元處理器蘋果電腦開始銷售方便自用的電路板,國防工業設立最早的網路ARPANET,資訊仍不成氣候。80年代家用電腦逐漸有銷路,IBM佔領商業電腦市場,銀行業也爭相購買大型主機負責金融交易與數據處理;通訊業者開始有網路服務供應商甲骨文公司(Oracle)成為世界最大的數據處理軟體業者,年收入僅次於微軟(Microsoft);有人創制網路控制的國際標準(TCP/IP),有發明WWW(萬維網)的統一標識,連最早的網路病毒都亮相了,可是‘資訊’一詞實在還太抽象。這些發展固然奠定基礎,但對於非科技業的人,恐怕與目不識丁沒兩樣,更別說參與投入。

真正水到渠成的催化劑,是1993年改良的網頁瀏覽器。人是視覺動物,眼睛若看不到,就難以判斷事物的實用;可是一旦看到,網路立刻變成炙手可熱的媒體新產品。不久論壇出現,大家踴躍討論意見;青少年熱衷於線上日記或自做網頁;畢業生標榜網站經驗求職;公司怕競爭被淘汰而積極僱用網路工程師電郵、網路新聞、即時通訊網際通話、網路購物、社交網線上游戲,都在短短幾年內變成許多人的每日需要。

而也在這期間出現兩種異動。第一種是對等網路(P2P),也就是每個用戶都不需經過一般網站的中央服務,而是各自形成服務器,藉著整個群體交流信息,所以能取得文件卻不容易追踪。對於想保障隱私、盜版音樂電影的人,對等網路可說是無上福音;甚至後來的網路貨幣流通、網路黑市販毒,也是靠這種難以查詢的線上活動。首先遭新科技威脅的自然是娛樂業,之前高價賣的唱片,可能只有一首歌值得,很多人寧可從網路上抓,抵制唱片公司賺取暴利;音樂界想要打壓網路上的文件交換,卻難以斬草除根,而隨著電腦容量擴大、網路速度加快,連尚未播放的電視節目或剛殺青的電影,往往都在幾小時內成為年輕人惠而不費的娛樂,更有人說,網上哪有人花錢買色情?言下之意,免費就是網路帶給人最棒的福利。這看法道德與否不討論,‘資訊’的定義已涵蓋古往今來所有智慧產品。

第二種異動,是大量資料的蒐集堆積。谷歌(Google)臉書(Facebook)都是代表。它們固然也提供其他服務,但他們最重要的收入來自廣告費;要廣告就得投其所好,知道每個用戶想買什麼;而要了解,就要先看個人電郵短訊、查詢消費習慣。對這些公司,收集資料並不困難,免費的背後,很多人已經習慣甚至樂意與人分享,舉凡珍藏幾十年的絕版書報,或是自己數位拍攝的照片,都逐一搬到網路上(就是所謂雲端)。既有資料,要查出一個人生日家庭、證件號碼、學校工作記錄、收入資產、犯罪前科、病歷服藥都可以,連吃什麼早餐、用什麼牙膏、聽什麼廣播的嗜好也清楚。一個人腦容量有限,頂多只能認識150人;但公司們要認識用戶,憑電腦大量記憶就夠了,可說天下無難事,只怕有心人。

然而堆積了這麼多資料,又代表了什麼?

*     *     *     *     *

中世紀煉金術認為,一個人包含水35公升,碳20公斤,氨4公升,石灰1.5公斤,磷800克,鹽250克,硝石100克,硫磺80克,氟7.5克,鐵5克,矽3克,其他少量元素十五種,但全部加在一起卻不能變成人。科技發達後,專家也開始實現人類基因組計劃,不過就算能解開每個基因的奧秘,加起來仍不等於一個人。同樣地,現在社會努力獲得個人資料,但難道這些資料本身就等於人?

我們對資訊要問的問題太多了。首先,資料可信麼?所謂盡信書不如無書,線上資訊只會更混亂。青少年為了不讓人知道自己在鬼祟什麼,很多報假名、改性別、亂填資料、謊稱成年;交友網站上的用戶,多半用修飾照片,有的謊報身高年齡三圍,有的不公開自己已婚,更沒有人直認有性侵記錄。有不少網站為了向投資人證明自己創辦成功,連假用戶也得濫竽充數。相反地,每家公司網上徵人,都習慣把履歷表中的花團錦簇打了折扣再評量。一般人讀了網頁上的訊息,會直覺地懷疑,因為可能是變相廣告,可能是惡意誣衊,可能是無名氏不負責任亂講,可能是無聊人故意找話題鬥嘴。真實世界通常要篩選資料,鑑別專家,否則債台高築的人談投資致富,報社連刊登都嫌對聲譽有累;但網路讓任何人都能自己當主編主播,於是狗皮膏藥也能吹噓為萬應靈丹;垃圾郵件更不在話下。甚至詐騙在科技輔助下,偽造身份易如反掌,也讓各國調查局難以追踪。

不過另一方面,資料誰在看?政府?保險業?行銷公司?非法集團?愛挖瘡疤的記者?喜歡三姑六婆的親屬?善妒的前妻?報復的男友?很多人太隨便與人分享資料,等到緋聞艷照曝光後才又哭說自己是受害者。沒有網路之前,明星偶像會有經紀人幫忙建立、保持形象;網路固然可以讓人一夕成名遍天下,但大部分人並不懂得如何培養或維護形象,結果把自己招牌砸爛了還懵然不知。這是個人魯莽,不提也罷。比較危險的是由於錯誤資訊而遭殃:有人無法開銀行戶頭,應聘也沒被錄用,甚至租房子都被刁難,只因某個同名同姓的刑事犯被逮捕時,政府人員把資料搞混;這種麻煩已不罕見,可惜如此細微的問題卻會讓無辜人一生受苦。更危險的是匪徒駭客專門鎖定某種資料,伺機竊取,畢竟‘金玉滿堂,莫之能守’,越值錢的資料就越有人下手。一家保險公司的電腦失竊,可能波及幾百萬人;一家大型連鎖店的顧客信用卡資料被盜,恐怕會使整個社損失上億。儘管密碼讓破解時間變長,解碼技術卻也每年進步,而最善於解碼的又莫過於網路駭客與情報機構。當然,世界各國政府都重視機密保管,但大家總是相互監聽,甚至對自己人民也防範猶恐不力。到最後資料越多,圍觀者也越多,然後人又擔心資料外洩而建築各樣防護牆,如此循環不息。

這樣講似乎危言聳聽,實際上資料價值為何?絕多數都是不值錢的。雖說人人平等,但許多人的生活實在枯燥乏味;單以一大堆社交網站所分享的照片來看,57%是食物,30%是自拍特寫,10%是自家寵物,毫無創意可言,甚至拍照幾萬張,連自己也沒翻過,更不知為何留念。假若有人認為手機可以讓人變成攝影藝術家,網頁能讓人變成文豪,線上書籍能讓人隨時進修,很抱歉,一般人並不是‘見賢思齊’的料,年輕人反倒爭相‘與下層看齊’。別人有刺青,自己也弄個刺青來拍照留念;當紅電影主角出口成‘髒’,線上視頻裡大家也髒話對喊。就算是正經內容,網路上仍有太多‘天下文章一大抄’,‘為賦新詞強說愁’,‘三過其門而不入’之類,要找值得的資料簡直是海底撈針。50年代有Sturgeon定律說:“90%的任何東西都是垃圾。”這是還沒有資訊劇增前的感慨,現在大概99.9999%的網路內容都是垃圾,即使儲存再多的資料也未必‘開卷有益’。舉例來講:假若國安局要尋找恐怖份子,因而搜索每個民眾的網路通話記錄,一億通電話也未必能獲得一分鐘的相關資料。不蒐集資訊,根本無法辦事;但蒐集了資料,有誰讀得完?就算讀完了,又有什麼意義?

換言之,沒有分析,再多的資料也是白費。可是這堆龐大的資料要靠電腦來分析也有不少問題,比方最基本的住址,沒有分項解讀,怎麼知道哪個是郵遞區號,哪個是公寓號碼?東亞記錄日期是用年月日排列,美國卻是月日年,而歐洲是日月年;其餘公制英制、攝氏華氏、成長率如何計算、價差以什麼為基準,諸如此類細節就讓人傷腦筋,單是整理出可用的資料格式已經要佔去大半時間。這才只是開頭。電腦系的人常說:“輸入垃圾,輸出也垃圾。”符合格式的數字未必合乎邏輯,一個人身高總不可能小於零,年齡總不會幾千歲;如此篩選適用的資料又會花不少手續。連數字都不易分析了,網路上浩瀚資訊幾乎以圖文居多,也沒有用戶愛填枯燥表格,怎麼辦?矽谷不少公司現在都在研究語義學(Semantics),任何能將一串文字符號轉化為含義的軟體系統,自然能領先市場,獨占商機。然而語義並不是文法;就算句法結構符合規格,就算網路搜尋可以根據輸入而提供建議,這只是憑大部分字句組合的常用性猜測,與含義還相去甚遠。

坦白講,電腦網路記憶驚人,看似聰明,其實連五歲孩子能理解的事,電腦都做不到;它可以辨認指紋,可以立體模擬一張臉,甚至可以查出這人的身世背景,卻不能判斷他手上拿的盒子,是要給孩子的禮物。人工智慧專家Ray Kurzweil曾下定義:“能有目的地消除資訊,就是聰明的第一個表徵。”其實每個人眼睛每秒鐘也捕捉了許多資料,但人並沒有‘過目不忘’地記憶這些資料,而是抓到重點,然後把其他的刪掉;所以我們看到別人能直覺地認得是誰,倒是連自己父母孩子的五官都未必能正確形容——畢竟無誤地描繪一個人幫助不大,能知道對方是誰而適當溝通才更重要;記住別人的生日血型學校成績,益處還小,能在接觸中認知對方今天很累很忙很消沉,了解對方興奮什麼擔憂什麼生氣什麼,才是日常生活所需的‘本能’。也可以說,現在電腦還做不到人類的歸納整合推理判斷。它能搜索西洋棋下一步的所有可能性,但這僅限於有固定規則的環境;人類卻無時無刻地編出新準則、更改舊條例、剔除壞習慣。思考學習,就是為了不必去累積所有繁複的資訊:一個萬有引力公式可以取代幾千年的渾天儀記錄,一種病理研究可以解釋幾萬人的不明症狀,一句至理名言可以涵蓋幾百代的跌倒站起。當然,電腦軟體仍在持續進步,今日出現無人駕駛的汽車,十年二十年後照樣會日新月異;但資訊理論並不會改變——不簡化,就不算聰明。

可惜簡化的同時,人也不斷增加新資訊,而且增加的速度比整合歸納還快。今日很多人靠知識賺錢,即使是針對每家公司的業績利潤員工薪資產品反應,資訊都已經多如洪水;何況知識還衍生更多知識。舉例而言,市場競爭會促進產品改良,但怎麼改良、誰負責改良、何時開始改良、要多少預算、是否有產權專利問題、改良後如何評量、如何測試消費者滿意程度、若達不到預期要怎樣善後等等,都是之前沒有的資訊。越上層的經理董事,越需要面面俱到,也因此大家努力開會研討查資料問專家,唯恐一點疏忽,擔當不起責任。職場以外,人還是每天面對數不盡的資訊:有房子的人會閱讀稅金貸款的項目,有車子的人會注意維修保養的要訣,有孩子的人會著重師資校友的水準,有投資的人會擔心報酬風險的變動,有電腦的人會顧忌病毒隱私的問題,想購物的人在網上不是‘貨比三家’,而是‘貨比三十家,每家三十款’。在乎的事情多,要找的資訊也更多。就算不想碰資訊,資訊一樣隨著媒體廣告氾濫、親友口耳相傳;何況很多人吸收資訊已經上癮了,不查網路比不吃飯還難熬。但是人終歸受限於腦神經科學,攝取得多,能轉化為養分麼?或者徒然耗時耗力而已?

究竟資訊轟炸下,人類想學的是什麼?又是否真學到了呢?

        我們在資訊裡面失去的知識,到哪裡去了?
        我們在知識裡面失去的智慧,到哪裡去了?
                        ——艾略特(T. S. Eliot)《磐石》,1934年

No comments: