返回

第579章 護航

首頁
關燈 護眼 字體:
書架 上一章 目錄 下一章

快影上面那些東西的成功並不是一蹴而就的,後面還有很多人在努力。

我們再把時間倒回九月。

“大國重器”第一期講航母那天晚上,黃河AI實驗室的值班系統就彈出了一條預警。

預警不是人發的,是算法自己跑的。

實驗室裏有一套叫“觀瀾”的系統,專門用來監測互聯網上的信息變化——不是看流量,是看內容的走向和關聯。

這套系統是何耀宗讓老譚帶着團隊花了兩年搭起來的,原本是用來分析競爭對手的動態,後來發現用來監測輿情也挺好使。

那天晚上,“觀瀾”抓到了一個異常:某度百科上“16號艦”詞條的歷史版本,在節目播出後四十分鐘內被修改了三次。

修改的內容不是什麼技術細節,而是把“中國第一艘航母”改成了“中國第一艘改裝航母”,又在後面加了一句“前身是蘇聯海軍的瓦良格號”。

這句話本身沒錯,但放在那個時間點,味道不對。

AI實驗室的值班工程師姓孫,三十出頭,清華計算機系畢業,在黃河幹了五年。

他看到這條預警的時候沒太當回事,覺得可能就是哪個較真的網友在較勁。

他把這個異常標註了“低風險”,關了窗口繼續盯別的。

但“觀瀾”沒停。

接下來的三天,它又抓到了十幾個類似的異常。

某度百科上“殲-20”的詞條被改了五次,有人反覆把“隱身戰鬥機”改成“低可探測性戰鬥機”,又在後面加了一句“與F-35相比仍有差距”。

搜狗百科上“光刻機”的詞條被人加了一段,說華高科的光刻機“技術來源存疑”,“核心部件依賴進口”。

甚至連快影自己的百科詞條都被動了,有人在“主要業務”那一欄加了一句“以民族主義內容吸引流量”。

孫工這回覺得不對勁了。

他把這些異常整理成一份報告,發給了老譚。

老譚看完報告,在辦公室裏坐了一會兒。

他不是技術出身,但跟何耀宗幹了這麼多年,對這些東西的敏感性還是有的。

這些修改,單獨看每一條都說得通。

16號艦確實是改裝來的,目前殲-20外顯的數據確實跟F-35有差距,華高科的光刻機早期也確實用過進口部件。

但把它們放在一起看,就有一條清晰的線:有人在系統性地弱化“大國重器”系列節目裏提到的一切成就。

他拿起電話,撥了何耀宗的號碼。

“何總,有個事得跟您說一下。”

何耀宗聽完,讓老譚把報告發到他郵箱。他看了半小時,然後給孫工打了一個電話。

“觀瀾系統能不能追蹤這些修改是誰幹的?”

孫工說能,但需要時間。

“百科類平臺的修改記錄是公開的,但只能看到用戶名,看不到IP。我們可以通過編輯時間和編輯習慣做行爲聚類,把同一個人的不同馬甲串起來。這個需要跑幾天數據。”

“跑,跑出來告訴我。”

三天後,孫工把結果發過來了。

那些修改“16號艦”“殲-20”“光刻機”詞條的用戶名,雖然看起來五花八門————有的叫“歷史愛好者1984”,有的叫“技術中立派”,有的叫“實事求是的人”——但行爲聚類結果顯示,這些賬號的編輯時間集中在工作日的上午十

點到下午四點,週末幾乎不動。而且它們修改的詞條有一個共同特徵:全部是“大國重器”節目提到過的內容。

“這不是普通網友。”孫工在報告最後寫了一句,“這是有人在上班時間專門幹這個。”

何耀宗把報告打印出來,裝進公文包裏,開車去了九十五號院。

何雨柱在書房裏看報告。他翻得慢,每一頁都看得很仔細。看完之後沒說話,把報告放在桌上,靠在椅背上想了一會兒。

“這個‘觀瀾”系統,能監測到別的平臺嗎?”

何耀宗道:“能監測,原理都一樣。只要平臺開放詞條編輯或者內容發佈,就能抓取歷史版本做比對。但有些平臺不開放歷史版本,比如某書和某呼,用戶發了文章之後自己可以修改,但外人看不到修改記錄。這種我們抓不

到。

“那你怎麼知道他們有沒有被投餵?”

“看結果。如果同一段時間內,多個平臺同時出現大量內容,主題一致、論點一致,措辭相似,那大概率是有組織的。觀瀾已經在跑了,目前看下來,某書和某呼上確實出現了一批文章,主題就是質疑‘大國重器'裏提到的那

些技術成就是不是真有那麼厲害。”

何雨柱問:“什麼樣的文章?”

何耀宗從包裏又掏出一份報告,翻到其中一頁。

“這篇是發在某呼上的,標題叫《華高科光刻機的真實水平》。文章說華高科的第四代光刻機‘不過是ASML五年前的水平,說‘核心部件仍然依賴進口,說‘量產良率遠低於對外宣傳的數據。每一條都似是而非,外行看了會

信,內行看了知道是在胡說。但普通人分不清。

“發文章的人查了嗎?”

“查了。用戶名是‘芯片行業觀察”,註冊時間是今年三月,一共發了十七篇文章,全部是質疑國內半導體產業進展的。我們查了這個賬號在其他平臺的活動軌跡,發現它同時在某乎、微博、今日頭條上發內容,而且在不同平

臺上的措辭幾乎一模一樣。這不像個人行爲,像是有統一供稿來源。”

何雨柱拿起那份報告又看了一遍,然後放下。

“你覺得這是誰幹的?”

何耀宗想了想道:“不一定是北美那邊直接出手。可能是他們資助的某個機構,也可能是國內那些靠反流量喫飯的人。但不管是誰,目的是一樣的——把水攪渾。我們講一個東西是真的,他們就說是假的。我們講一個東西是

領先的,他們就說是吹牛的。來回拉扯,把觀衆搞糊塗了,就不信了。”

何雨柱點點頭。“你打算怎麼辦?”

何耀宗說:“技術上我們能做的有限。百科類平臺我們可以自己去改回來,但改完他們又會改回去,拉鋸戰打不完。某書某呼上的文章,我們沒法直接刪,那是人家的地盤。我想找老周,讓相關部門出面協調。”

何雨柱搖搖頭。“直接找老周,他肯定願意幫忙。但你得想清楚,這不是一次兩次的事。你今天讓相關部門協調改幾篇,明天他們又發十篇。你能每次都去找老周?”

何耀宗沒說話。

何雨柱站起來,走到窗前。“這事分三步走。第一步,技術層面,你們那個觀瀾系統繼續跑,把證據攢夠了。誰在改,什麼時候改的,改了什麼東西,一條一條記錄清楚。將來要用的時候,拿出來就是鐵證。第二步,你去找

那幾個平臺的人,不是找老周去壓,是你自己去談。你告訴他們,有人在利用他們的平臺搞事,把證據給他們看。他們要是聰明,自己會處理。他們不處理,你再去想別的辦法。第三步,你自己建一個知識庫。百科類的東西,別

人不讓你改,你就自己建一個。黃河科技不是有技術嗎?搭一個知識平臺,把那些被篡改的詞條用原始版本和修改版本對照着放出來,讓用戶自己看。你改你的,我放我的。誰在說實話,誰在搞鬼,用戶看得出來。

何耀宗愣了一下。“自己建百科?那投入不小。”

“不小也得建。別人掌握着定義權,你就永遠被動。他們說什麼是什麼,你永遠在解釋。你自己建一個,把定義權拿回來。”

何耀宗想了想,點了點頭道:“回去我就安排。”

何雨柱又說了一句:“還有,你那個觀瀾系統,別光盯着中文。英文的、日文的、德文的,都要盯。那些人在中文平臺上搞事,在英文平臺上也不會閒着。維基百科上那些詞條,你看看被改成了什麼樣。”

何耀宗說好。

何耀宗回到公司,第一件事是把孫工叫了過來。

“觀瀾系統要擴。不光是中文,英文、日文、德文,能覆蓋的都覆蓋。維基百科是重點,那邊的詞條被改成什麼樣,我要知道。”

孫工問:“預算呢?”

“沒有預算上限。你需要多少人、多少服務器,我給你批。但有一條——數據要準。你報上來的每一條修改,都要能追溯到具體的時間和賬號。”

孫工點點頭,轉身出去了。

第二件事是聯繫那幾個平臺。

何耀宗讓助理約了某度百科、搜狗百科、某呼、某書四家平臺的負責人,說要“交流一下內容生態治理的經驗”。

對方都很客氣,答應得也痛快,但見面時間排到了一週以後。

何耀宗沒等。

他把觀瀾系統跑出來的數據整理成一份簡報,讓人給四家平臺各送了一份。

簡報沒提任何要求,就是把那些被篡改的詞條、被投餵的文章、修改時間、賬號行爲聚類結果,一條一條列了出來。

最後附了一句話:“貴平臺的內容生態可能正在被有組織地污染,供參考。”

當天下午,某度百科的人就回了電話。

對方很客氣,說感謝黃河AI實驗室提供的數據,他們已經覈實了部分詞條的修改記錄,對違規賬號進行了封禁處理,並表示願意與黃河建立長期的內容合作機制。

搜狗百科和某書的反應也差不多。

唯獨某呼,沉寂了兩天,然後一個產品總監打來電話,說“我們有自己的內容審覈機制,不勞黃河操心”。

何耀宗沒跟他爭,說了一聲“好的”,掛了電話。

第三件事是建自己的知識平臺。

這個活兒他交給了老譚。

老譚聽完之後,說了一句:“何總,這事兒不小。百科類產品看着簡單,背後是一整套內容生產、審覈、更新、爭議解決機制。光搭個架子不難,難的是內容從哪來。你不能自己寫吧?寫不過來的。”

何耀宗說:“內容從兩個地方來。第一,黃河旗下所有公司的技術資料、產品數據、專利信息,全部入庫。這些都是我們自己的一手數據,別人沒法反駁。第二,跟‘大國重器’節目聯動。每一期節目播出之後,相關的技術詞

條同步更新,把節目裏講的內容用文字形式沉澱下來。節目講的是故事,百科講的是事實。故事和事實互相印證,觀衆就更信了。”

老譚又問:“爭議怎麼辦?有人上來改你的詞條,或者在你下面留言罵你。”

何耀宗說:“爭議是好事。有人來改,說明他關注。但我們不搞開放式編輯,內容由我們自己的團隊維護。用戶在下面可以留言,可以提意見,可以質疑,但我們不改。我們有異議處理機制,用戶提交的每一條異議都要經過

覈實。覈實屬實的,我們改。覈實不屬實的,我們不理。把審覈流程公開,讓用戶看到每一條修改背後的依據是什麼。”

老譚說行,回去就搭團隊。

何雨柱在書房裏接到了老周的電話。

老周沒繞彎子。“何老,有人在網上搞事,你知道了吧?”

何雨柱說知道了。

“我們也在盯。那幾個百科類平臺的事,我們已經跟網信辦溝通了,他們會出面對平臺進行約談。某呼那邊態度不太配合,但問題不大,他們有上級主管部門。

何雨柱說:“不用太急。讓他們蹦,蹦得越高越好。”

老周說:“還有一件事。維基百科那邊,有人在大量修改與中國相關的技術詞條。修改的方向很一致————凡是‘大國重器’節目裏提過的內容,都被弱化或者質疑。我們的人查了一下,修改賬號的IP分佈在全球十幾個國家,但行

爲模式高度相似。不像是散兵遊勇,像是有組織的。’

何雨柱問:“能查出來是誰在組織嗎?”

老周說:“查不出來。那些IP用了VPN,源頭不好追。但有一點——這些賬號的活躍時間,跟北美東海岸的工作時間高度重合。早上八點到下午六點,週末休息。這個時間規律,不像是業餘愛好者的行爲。”

何雨柱沉默了兩秒。“把證據攢好。後面用。”

老周說好。

九月下旬,“大國重器”第二期上線那天晚上,觀瀾系統又彈出了一堆預警。

這次不是百科詞條,是某呼上的一篇文章。

文章標題叫《99A坦克真的世界領先嗎?》,作者是個新註冊的賬號,名字叫“裝甲兵觀察”。

文章用了一大堆似是而非的數據,試圖證明99A的火控系統、裝甲材料、動力系統都“與西方主流坦克有代差”。

文章發出來之後,被某呼推上了首頁。

評論區裏吵成一片,有人說“說得對,別吹了”,有人說“作者你懂個屁”。

孫工把文章鏈接發給何耀宗。

何耀宗看完,讓觀瀾系統跑了這篇文章的作者行爲軌跡。

結果顯示,這個“裝甲兵觀察”的賬號,跟之前修改百科詞條的那批賬號在編輯時間上高度重合——都是工作日白天活動,週末休息。

何耀宗把這條信息轉給了老周。老週迴了一句:“知道了。”

第二天,那篇文章被某呼刪了。

但刪之前,已經被轉到了好幾個平臺,包括微博和朋友圈。

何耀宗讓老譚加快知識平臺的建設進度。

老譚說團隊已經搭起來了,二十幾個人,分內容組、技術組、審覈組三個方向。

內容組正在整理黃河旗下各公司的技術資料,技術組在搭平臺架構,審覈組在設計異議處理流程。

“一個月內,第一版能上線。”老譚說。

何耀宗說:“太慢。三週。”

老譚咬了咬牙:“行,三週。”

十月初,第三期“大國重器”播出前後,投餵的數據開始變本加厲了。

某呼上出現了一篇長文,標題叫《殲-20的真實性能:被誇大的隱身與被低估的差距》。

文章寫得很“專業”,用了大量術語、圖表、數據對比,看起來像是業內人士寫的。

文章的核心論點是:殲-20的隱身設計“抄襲了F-22”,發動機“落後美軍兩代”,雷達“不過是F-35的水平”。

這篇文章被某呼推上了熱榜第一。評論區裏,有人叫好,有人罵街,吵得不可開交。

觀瀾系統抓到了這篇文章之後,孫工跑了一遍作者的行爲軌跡。結果跟之前一樣————工作日白天活動,週末休息。

但這個賬號比之前的更隱蔽,它在某呼上只發了這一篇文章,註冊時間是三個月前,註冊之後什麼都沒幹,就等着這一天。

孫工把結果報給何耀宗。

何耀宗看完,給某呼的那個產品總監發了一條微信,把那篇文章的鏈接和作者行爲軌跡截圖發了過去,附了一句話:“有人在利用貴平臺傳播不實信息,供參考。”

對方回了四個字:“已轉相關同事。”

文章沒刪。三天後,它從熱榜上掉了下來,但還在。

何耀宗沒再催。他知道,某呼有自己的邏輯。

十月中旬,黃河知識平臺上線了。

名字叫“知源”,取的是“知識有源”的意思。

平臺的界面做得很乾淨,白底黑字,左邊是詞條目錄,右邊是正文。

每一條詞條下面都有兩個版塊:一個是“原始版本”,一個是“修改記錄”。

原始版本是黃河自己的團隊維護的,每一條內容都附了來源——專利號、論文鏈接,官方數據來源、第三方檢測報告。

修改記錄裏放的是觀瀾系統抓到的那些被篡改的版本,跟原始版本並排放在一起,用戶可以自己對照着看。

“知源”上線的第一天,放上去的第一批詞條就是“大國重器”節目裏提到過的那些:16號艦,殲-20、99A坦克、光刻機、盾構機、超高壓輸電。每一條都寫得極其紮實,每一個數據都有來源。

顧念禾在快影上給“知源”做了一個推廣視頻。

視頻裏沒說什麼大話,就是把“知源”的界面截了幾張圖,說:“有人在網上改百科詞條,把真的改成假的。我們自己做了一個知識平臺,把真的放在這兒。你們自己看,自己判斷。”

視頻發出去之後,播放量兩小時破了兩千萬。

評論區裏有人說“這纔是該有的東西”,有人說“我看了一下,內容確實紮實”,有人說“那些亂改詞條的人臉疼不疼”。

何耀宗在後臺盯着數據。

“知源”上線第一天,獨立訪問用戶破了五百萬。

大部分流量來自快影的導流,但也有不少是用戶自己搜過來的。

十月底,老周來了一趟九十五號院。

“何老,維基百科那邊的事,我們跟進了。查出來一批賬號,IP源頭在北美和歐洲。我們通過外交渠道跟維基媒體基金會做了溝通,對方表示會‘關注’。但實際效果不大,那些賬號還在活動。”

何雨柱說:“維基百科的事不急。我們自己有知源了,慢慢來。”

老周又說:“某呼那邊,我們約談了他們的負責人。他們的態度比之前好了一些,答應加強內容審覈。但那個平臺的基因就是這樣,喜歡搞爭議內容。你讓他把有爭議的東西全刪了,他就不叫某呼了。”

何雨柱說:“某呼不用管。他們願意搞爭議,就讓他們搞。但有一條——如果他們平臺上的內容涉及違法,比如造謠、誹謗、侵犯名譽權,該告就告。黃河的法務團隊不是喫素的。”

老周笑了笑。“行,這個你們自己來。”

十一月,“西洋鏡”系列上線了。

這一次,投餵的數據更離譜了。

“西洋鏡”第一集講古希臘史,播出之後第二天,某呼上就出現了一篇文章,標題叫《古希臘文明的真實性:爲什麼中國網友的質疑是反智的》。文章寫得很有“學術範”,引了一堆西方學者的名字,說了一大堆“共識”“主流

學界”“學術規範”之類的話,核心論點是:質疑古希臘文明真實性的人,都是“民科”和“反智主義者”。

這篇文章的評論區裏,有人貼出了穆勒在歐洲查到的那些檔案截圖——大英博物館修改入藏記錄的證據、盧浮宮武力奪取文物的證據。貼截圖的人說:“你們說別人反智,那你們解釋一下這些東西唄。”

文章作者沒回復。但第二天,那篇文章被修改了,加了一段話:“個別文物來源問題不能否定整個古希臘文明的價值。”

觀瀾系統把這次修改也抓了下來。

何耀宗看了之後,跟老譚說了一句:“他們急了。”

老譚說:“急了就好。急了就容易出錯。”

十一月下旬,某呼上又出了一篇文章。

這次不是質疑“西洋鏡”,是直接攻擊“知源”平臺。

文章標題叫《黃河的“知識平臺”:是知識還是宣傳?》。

作者是個實名認證用戶,頭銜寫着“某大學副教授”。

文章說“知源”平臺上的內容“選擇性地呈現事實”,說“把百科詞條改成對自己有利的版本是反互聯網精神的”,說“黃河在搞信息繭房”。

這篇文章被某呼推上了熱榜前三。

何耀宗看了之後,讓法務團隊準備了一份律師函。

不是因爲文章批評“知源”,而是因爲文章裏有一句話——“黃河通過旗下快影平臺和知源平臺,系統性操縱公衆認知”。

這句話涉嫌誹謗。

律師函發出去之後,那篇文章被某呼刪了。

那個副教授後來在自己的微博上發了一條道歉聲明,說“文章部分表述不夠嚴謹”。

何耀宗沒再追究。

十二月,何雨柱在書房裏看了一份“知源”的運營報告。

上線一個半月,獨立訪問用戶累計三千七百萬,詞條數量從第一批的二十幾個擴展到了三百多個,涵蓋了黃河旗下所有公司的技術領域,以及“大國重器”和“西洋鏡”節目提到的大部分內容。用戶提交的異議有兩千多條,經核

實屬實的有一百多條,已經全部修正。覈實不屬實的,在詞條下面加了“用戶異議”版塊,把用戶的質疑和平臺的回覆一起放出來。

報告最後附了一句話:“知源正在成爲中文互聯網上技術類詞條最可靠的來源之一。”

何雨柱把報告放下,給何耀宗打了一個電話。

“知源做得不錯。但別光做技術類。歷史、文化、藝術,這些領域也要做。念禾那邊有手稿,有檔案、有證據,你跟她對接,把那些東西也放上去。有人在網上改百科詞條,把敦煌經卷的數量少,把流失文物的價值貶低,

把西方博物館的掠奪美化成‘收購’。你把這些證據放上去,一條一條對應着放。讓他們改,改一次你記錄一次,把記錄放在知源上。誰在說實話,誰在搞鬼,用戶看得出來。”

何耀宗說好。

何雨柱又說了一句:“觀瀾系統別停。那些人不會收手的。你這邊越做越大,他們那邊越急。急了就出昏招。出昏招就露馬腳。露馬腳就捱打。”

何耀宗說:“明白。”

當天晚上,何耀宗給顧念禾打了一個電話,讓她派人來對接“知源”的內容建設。

顧念禾說:“耀宗舅,我有個想法。‘西洋鏡’系列第三集講兩河流域的時候,方博士提到了一件事——伊拉克國家檔案館裏有一份奧斯曼帝國的許可證,上面寫的是‘允許伍利先生進行考古調查,所獲文物歸帝國博物館所有。

這份許可證的原文和翻譯,能不能放到知源上?”

何耀宗說:“能。不但要放,還要做成一個專題。把伯希和的日記、斯坦因的日記、法國外交部的報告、英國軍部的備忘錄,所有能證明文物來路不正的證據,全部做成專題放上去。每一個證據都附原件照片,翻譯文本、檔

案來源。讓用戶自己看,自己判斷。”

顧念禾說好。

十二月中旬,知源上線了一個新板塊,叫“流失文物證據檔案”。第一批放上去的是敦煌經卷的證據——斯坦因的日記摘錄、大英博物館的內部備忘錄,伯希和日記裏關於“挑選”藏經洞文物的記錄、法國外交部關於“購得”敦煌

文物的撥款文件。每一條證據都有原件照片,中文翻譯、檔案來源鏈接。

這個板塊上線之後,快影上有人做了一期短視頻,把知源上的證據一條一條唸了出來。視頻的最後,唸的人說了一句:“這些東西,不是我們編的。是英國人自己寫的、法國人自己寫的。我們只是把它翻出來,放在這兒。你

們自己看。”

視頻播放量破了三千萬。評論區裏有人說“這纔是真正的證據”,有人說“大英博物館還有什麼話說”,有人說“知源這個平臺太狠了”。

當天晚上,大英博物館的官網悄悄更新了“藏品來源研究項目”的頁面,加了一句話:“敦煌文物的來源審查正在進行中,預計2021年完成。”

顧念禾截圖發給何雨柱。何雨柱看了,說了一句:“2021年?拖字訣。不急,讓他們拖。證據在我們手裏,時間在我們這邊。”

十二月下旬,何耀宗在公司開了一個會。

參會的是老譚、孫工,還有“知源”團隊的主要負責人。

何耀宗說:“知源上線兩個月,數據不錯。但有一個問題——現在的用戶主要來自快影導流,自然搜索佔比還不到百分之三十。這意味着大部分用戶還是靠快影才知道知源,而不是主動來找的。下一步的目標,是把自然搜索

佔比提到百分之五十以上。”

老譚問:“怎麼提?”

何耀宗說:“SEO優化搜索引擎排名,讓用戶在某度、搜狗上搜一個技術詞條的時候,知源的結果能排在前三。這個需要時間,但可以做。另外,跟學校合作。大學、中學的老師,如果願意在課堂上推薦知源,我們就給他

們開專門的教師賬號,可以批量下載詞條內容用於教學。”

孫工說:“技術上好實現。但內容上,我們需要更多的詞條。現在三百多個,遠遠不夠。用戶搜一個東西,如果知源上沒有,他就去別的地方了。”

何耀宗說:“內容的事,我已經跟念禾說了。她的手稿庫裏有大量歷史、文化、藝術類的一手資料,可以做成詞條。黃河旗下所有公司的技術資料也在整理中。明年年底之前,詞條數量要做到三千以上。”

散會之後,何耀宗回到辦公室,給何雨柱打了一個電話。

“爸,知源的事在推進。明年年底之前,詞條數量做到三千以上。觀瀾系統也在跑,最近一個月抓到的異常修改比上個月少了百分之三十。不是他們收手了,是百科類平臺開始主動封禁了。上次給某度送的那批數據,他們封

了一百多個賬號。”

何雨柱說:“少了好。但別放鬆。他們會換馬甲、換平臺、換手法。你這邊要盯緊了。”

何耀宗掛了電話,他站在窗前看着深圳的夜景。

遠處是科技園那些亮着燈的寫字樓,近處是快影的logo,在夜空中一閃一閃的。

他想起父親那句話,誰在說實話,誰在搞鬼,用戶看得出來。

這句話說得對,但不全對。

用戶看得出來,前提是用戶能看到真相。

如果真相被埋在一堆假話下面,用戶翻都翻不到,那看得出來也沒用。

知源要做的,不是跟那些人吵架,是把真相放在那兒,讓想找的人能找到。

他在窗前站了一會兒,轉身回到辦公桌前,打開電腦,開始看知源後臺的數據。

十二月二十八號,BJ。

老周進了何雨柱書房也不寒暄了,開門見山道。

“何老,有個事想跟您商量。

何雨柱在他對面坐下,等着他說。

“你們那個觀瀾系統,我們看了。好使。我們那邊現在用的還是人工篩查加關鍵字匹配,效率太低。這次百科詞條被改的事,我們的人發現的時候,已經改了好幾天了。你們那邊是當天就抓到了。

何雨柱沒接話。

老周繼續道:“不光是這次。去年開始,網上那些亂七八糟的東西越來越多,光靠人眼看,看不過來。我們也想過上系統,但自己搞,一是慢,二是不知道做成什麼樣。你們這個觀瀾跑了一年多了,效果擺在那兒。上面幾個

部門商量了一下,想問問能不能給我們也升級一下。”

“你們現在用的是哪套?”

老周道:“就是你們二零零三年給做的那套。後來升級過幾次,最近一次是一五年。但那個底子是信息採集和關鍵字匹配的架構,對付現在這些玩法不太夠。你們觀瀾用的是行爲聚類和語義分析,我們那套沒有這個能力。”

何雨柱想了想。“零三年那套,當時給你們做的時候,是黃河計算中心剛起步。現在技術迭代了好幾輪,要升級的話,不是換個軟件的事,底層的算法模型、數據架構都得換。

“知道。所以我們不是來要現成的,是想跟你們合作。我們出需求,出數據,出場景,你們出技術、出人、出算力。一起搞。錢的事,上面批了專項預算,按市場價走。”

何雨柱看了他一眼。“你們那幾個部門,都用的是同一套?”

老周道:“不完全一樣。有的偏信息採集,有的偏輿情分析,有的偏溯源追蹤。但底子都是零三年那套。這次想統一升級,做一個大的平臺,把幾個部門的需求都裝進去。”

何雨柱靠在椅背上想了想。“這事不小。我得讓耀宗那邊評估一下,看多長時間能做完。”

“您給個大概就行,不急這幾天。明年開春能啓動,年底之前能上線,我們就滿意了。”

何雨柱點了點頭。“行,我讓耀宗跟你們對接。”

老周站起來,走到門口又回頭。“何老,還有一件事。你們那個觀瀾系統,這次抓百科詞條修改的事,抓得很準。但你們有沒有想過,如果對方不在公開平臺上改,而是在後臺直接改數據庫呢?”

何雨柱看着他。

“我們查了一下,那幾個百科平臺,有的開放了API接口,允許第三方工具批量編輯詞條。如果對方不走網頁端,直接調接口改,你們的觀瀾還能抓到嗎?”

何雨柱沒回答這個問題。他站起來,送老周到門口。“這個我讓耀宗他們研究。”

老周走了之後,何雨柱在客廳裏站了一會兒。小滿從廚房出來,看見他站在那兒沒動,問了一句:“老周走了?”

“走了。”

“飯好了,喫吧。

何雨柱嗯了一聲,轉身往飯廳走。走了兩步又停下來,拿起電話撥了何耀宗的號碼。

深圳那邊是晚上,何耀宗接得很快。

“耀宗,老周剛纔來了。他們想升級監控平臺,用咱們的技術。另外他問了一個事——如果對方不在網頁端改,直接調百科平臺的API接口改詞條,觀瀾能不能抓到?”

何耀宗沉默了兩秒。“能。但得改一下抓取策略。現在觀瀾主要是抓網頁端的歷史版本對比,API接口的修改記錄我們沒怎麼關注。技術上能做到,需要加幾個接口。”

“加。”

“行。另外,爸,老周說的那個升級的事,他們以前那套系統是我們做的,底子我們熟。升級的話,核心是換算法模型和數據庫架構。工作量不小,但能做。我讓老譚跟他們對需求,年前出個方案。”

“別光做他們那套。觀瀾自己也要升級。這次百科詞條的事,說明有人在系統性地搞。他們不會收手,只會換手法。你的系統要比他們快一步。”

何耀宗說好。

十二月二十九號,何耀宗在公司開了一個會。

參會的是老譚、孫工,還有幾個技術骨幹。

何耀宗把老周那邊的事說了一遍。

“兩件事。第一,觀瀾自己要升級,加強對API接口修改的監控。第二,給老周他們做一套新的,用觀瀾的技術底子,但要根據他們的需求定製。”

孫工先開口道:“API接口那塊,技術上不復雜。百科平臺大部分都開放了編輯接口,我們只要去讀他們的修改日誌就行。關鍵是有些平臺的修改日誌不對外公開,只對合作方開放。這個需要老周那邊出面去談。”

何耀宗道:“老週會協調。你先把技術方案做出來。”

孫工點頭。

老譚問:“給老周他們做的那套,規模多大?”

何耀宗道:“他們沒說具體,但肯定是千萬級以上的數據量。幾個部門合用一個平臺,每天要處理的內容至少是觀瀾現在的十倍。算力方面,可以用貴州和雲南的算力中心,那邊還有富餘。數據存儲要重新設計,觀瀾現在的

架構撐不住這個量。”

老譚在本子上記了幾筆。

何耀宗又道:“還有一件事。老周他們那套系統,不能直接照搬觀瀾。觀瀾是我們自己用的,監控的目標是公開信息。他們那邊有很多內部數據源,涉密的、不公開的,接入方式和安全級別都不一樣。你要跟他們的人詳細對

需求,把數據安全這塊放在第一位。”

老譚說好。

十二月三十號,老譚帶着孫工去了老周那邊。對方派了一個處長對接,姓吳,四十出頭,搞了二十年信息化。

吳處長把他們帶到一間會議室,桌上攤着一摞需求文檔。老譚翻了翻,比他預想的厚。

“吳處,這些需求都要做?”

吳處長笑了笑。“不急,分批做。先做最核心的——全網信息採集、行爲聚類、溯源追蹤。這三個功能現在最缺。其他的可以往後排。”

孫工在旁邊問了一句:“數據源方面,你們能提供哪些?”

吳處長從抽屜裏拿出一張清單,遞過去。孫工看了一眼,上面列了幾十個數據源,有公開的,有半公開的,還有幾個標註了“內部”的。

“這些內部數據源,接口能開放嗎?”孫工問。

“能。但要走安全審計流程。每一筆數據調用都要有記錄,定期報備。”

孫工點點頭,把清單收好。

老譚道:“吳處,年前我們先出個技術方案,春節後啓動。如果順利的話,年底之前能上線。”

吳處長道:“行。有什麼需要我們配合的,隨時說。”

十二月三十一號,下午。

何雨柱在書房裏看何耀宗發來的觀瀾升級方案。方案不長,幾頁紙,核心是兩條:一是增加對API接口的監控,二是優化行爲聚類算法,把誤報率降下來。

他把方案看完,放在桌上。窗外天已經暗了,院子裏亮起了燈。遠處有零星的鞭炮聲,斷斷續續的。

何耀宗發來一條微信:“爸,觀瀾升級方案您看了嗎?”

何雨柱回了一條:“看了。讓他們做。別拖到年後,年前就啓動。”

何耀宗回了個“好”。

何雨柱把手機放下,站起來走到窗前。院子裏那棵樹光禿禿的,路燈照在枝丫上,影子落在雪地上,細細碎碎的。

小滿從廚房出來,站在客廳門口。“老周那邊的事談完了?”

“談完了。年後啓動。”

“那過年的事呢?今年怎麼安排?”

何雨柱轉過身。“老規矩。初一都過來。”

小滿點了點頭,轉身回廚房了。

何雨柱站在窗前又看了一會兒。遠處又響了一掛鞭炮,噼裏啪啦的,在冷空氣裏炸開,聲音傳過來的時候已經悶了。

他想起老周問的那個問題——如果對方在後臺直接改數據庫,觀瀾還能不能抓到。

能。改一下抓取策略就行。

但老周沒問的那個問題纔是關鍵——如果對方不修改現有的詞條,而是直接刪除,然後重新建一個呢?刪除操作有沒有日誌?日誌保不保留?保留多久?誰有權訪問?

這些不是技術問題,是平臺治理的問題。技術能解決的,有限。

他轉過身,走回書桌前,拿起筆在觀瀾升級方案的最後加了一行字:“增加對詞條刪除和重建行爲的監控。不僅要看改了什麼,還要看刪了什麼,新建了什麼。”

寫完之後,他把方案拍了一張照片,發給何耀宗。

何耀宗秒回:“收到。加上。”

上一章 目錄 下一章 存書籤
熱門推薦
離柯南遠一點
整座大山都是我的獵場
警報!龍國出現SSS級修仙者!
刑警日誌
重生1977大時代
我有十萬億舔狗金
神級插班生
剛準備高考,離婚逆襲系統來了
娛樂帝國系統
半島小行星
都市極品醫神
重生08:從山寨機開始崛起
重生1958:發家致富從南鑼鼓巷開始
原神我是史萊姆