(網經社訊)最近看到黃奇帆教授在第三屆外灘金融峰會上關于數據治理的發(fā)言,系統地論述了其對數據權利和數據交易有關規(guī)則的思考,很受啟發(fā)。雖然我并不認同黃教授的大部分觀點,但也不得不佩服黃教授作為一個非法律專業(yè)人士對數據治理這一全新領域的系統性思考。同時這事也促使我盡快拋出自己對數據治理法律問題的解決方案,供大家討論。
之所以我將這篇文章命名為“基本邏輯”,就是覺得在這一全新領域,很多最底層的概念和原理還沒有分析清楚或者達成基本的共識,而這些會構成我們討論數據權利、數據交易和權利歸屬的前提。這些概念和原則至少應該包括:
數據治理的概念、數據的概念、數據的基本特性,等等。
首先,關于數據治理的概念,可以有兩種,黃教授的文章里所說的數據治理,指的大概是第一種,即治理數據和治理數據產業(yè)。包括數據立法和數據產業(yè)立法等,《個人信息保護法》、《數據安全法》等都在這一層次里,我個人也傾向于把數據治理限定在這一層次討論。
另一種概念則是利用數據實施治理,這個范圍就很廣了,可以理解為治理的數據化和信息化,是治理現代化的核心或重要組成部分。這里即包含對數字經濟和社會的治理,也包括對實體經濟和社會的治理。
其次,關于數據的概念,又可以有三種,第一種過于大,第二種過于小,第三種比較合適,但也有一定的局限性。
第一種,廣義的數據基本等同于信息,泛指所有的信息或資料,在這一層次,你也可以把個人數據和個人信息劃等號。
比如,在百度詞條中有這樣的描述:大數據(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業(yè)經營決策更積極目的的資訊。也就是說,這里所引用的數據的概念,基本就是等同于信息和資訊的。
第二種,狹義的數據專指數字類信息,也就是我們對數據這一概念最本能和原始的反應。
《漢語大辭典》中對數據的定義是:數據shùjù〖data〗:科學實驗、檢驗、統計等所獲得的和用于科學研究、技術設計、查證、決策等的數值。相比于數字類信息,由于限定了使用范疇,顯然這一定義的范圍更狹窄。
第三種,指的是數字化的信息,即網絡空間以二進制代碼存在的所有信息,即這一層次的數據概念等同于網絡信息。
在計算機科學中,數據的定義是指所有能輸入到計算機并被計算機程序處理的符號的介質的總稱,是用于輸入電子計算機進行處理,具有一定意義的數字、字母、符號和模擬量等的統稱。
我國《數據安全法》中的定義,基本也是這個意思。其第三條明確規(guī)定:“本法所稱數據,是指任何以電子或者其他方式對信息的記錄。”
按照這一定義,我國的《數據安全法》可以理解為專門針對線上的,不能囊括線下數據安全。你也可以把它理解為“網絡數據安全法”。
最后,順便提一下大數據的概念,因為很多的政策文件,包括《數據安全法》里都引用了。在我的定義里,其實大數據更接近于一種全新的方法論,而不在于數據本身,只有順著這個思路才可能正確理解大數據。即大數據等于“全數據+笨辦法”。當然,這是阿拉木斯版的定義。
而在維基百科中,對大數據的定義是:在信息技術中,大數據是指一些使用目前數據庫管理工具或傳統數據處理應用很難處理的大型而復雜的數據集。在維克托·邁爾-舍恩伯格編寫的《大數據時代》 中,大數據指不用隨機分析法(抽樣調查)這樣捷徑,而采用所有數據進行分析處理。
關于數據的基本特性,也就是本文的主體部分。
在分析這部分時我們需要說明兩個大的前提:第一個就是涉及國家安全的數據問題的除外,我們本文里只討論民商事和行政管理領域與數據有關的問題;第二個前提是線上線下一體化原則,雖然很多問題是從線上出發(fā)的,但我們盡量囊括線下的各種應用場景,避免造就線下數據法律問題討論的盲區(qū)。
簡單地說,我認為,討論數據權利、權利歸屬等所有問題,都應該從論證清楚數據的基本特性出發(fā),才有意義,才可能站得住腳。數據的基本特性就是數據的“三性”,我概括為:細碎和附隨性、生成復雜性、功能多樣性。
提到三性,了解知識產權法律的人士會非常熟悉,我國著作權法中規(guī)定的著作權的三個基本特性是:獨創(chuàng)性、可復制性、合法性。而我國專利法中對專利權三個基本特性的定義則是:新穎性、創(chuàng)造性和實用性。我們可以毫不夸張地說,我國法律中著作權和專利權的相關權利和規(guī)則都是在這兩個“三性”的基礎上搭建的。
關于細碎和附隨性。數據的細碎性是顯而易見的,狹義的數據是信息的最小單元,就像物理世界里的原子。不管是1、2、3這樣的最簡單的阿拉伯數字還是0、1這樣的二進制代碼,都是所有信息里最基礎和簡單的元素。但這一特性帶來的法律問題可能是很多人沒有想到的,那就是,我們對這些信息元素的保護水平不可能太高,比如,不應該高于由大量這些元素組成的、門檻更高的知識產權。因為如果我們對數據的保護水平高于知識產權,就會影響知識產權的申請和保護,所有人都會算這個帳:既然我只要利用沒有任何門檻的數據保護機制就可以享受更高的保護,我還干嘛費那么大的勁去申請專利、商標、著作權呢?
概括一下,就是在法律這門科學里,我們不僅要考慮各種權益的保護問題,更要從更高更全面的角度研究保護與保護之間可能的各種沖突,這樣才可能建立真正有效且多贏的制度機制。
由于細碎和附隨這兩個特點關聯性很強,我就把它們放在了一起,作為一個特征描述。所謂附隨,當然不是絕對的,但絕大多數數據基本都是附隨某一個活動產生的,比如我們的交易數據、醫(yī)療數據、健身數據、聊天數據、共享單車騎行數據,等等。我們從事這些活動,目的不是為了獲得這些林林總總、如影隨形的數據,而是要實現交易、治療、健身、溝通和出行,數據的生成只是副產品。
既然邏輯是這樣,那就不能喧賓奪主。我們很可能愿意為了得到更好的交易、治療和健身、溝通、出行的服務而讓渡使用和分析我們數據的權利,這個要尊重個人的意愿和選擇,而不可以因為有高大上的法律在上而本末倒置,這樣的本末倒置只會讓我們的數字經濟和服務倒退。
關于生成復雜性。
即數據的生成是多樣化的,我們個人創(chuàng)造的數據當然是最清晰明確的,比如我們的姓名、我們的微信名和頭像等,但問題是絕大多數數據都不是這樣,比如我們的身份證號碼、銀行賬號,是系統生成的,交易記錄雖然是我們貢獻的,但也是基于系統設定生成的,駕駛記錄、信用記錄等則也是基于我們的行為和系統設置生成的。
在知識產權權利歸屬領域,比如一本張三寫的我的傳記的作品,當然編寫和公開都需要經過我的認可,但著作權權利歸屬肯定是張三而不是我。這可能成為我們確定數據權利歸屬的參考機制之一。
這里我們順帶談一下數據交易的問題。即黃奇帆教授提出的,“平臺應該把數據交易收益的20%到30%返還給數據的生產者”的問題。且不說這個數據生產者到底是誰,我們都知道,在我們現在的法律環(huán)境下,交易原始數據的法律風險極高,正規(guī)的企業(yè)應該不會去做這樣的事情,交易的一般都是衍生數據或分析數據等,一旦衍生數據成為匿名化數據,就脫離了我國《個人信息保護法》治理的范疇,所以這種返還的提法是有違行業(yè)常識的。
隨著《個人信息保護法》、《數據安全法》的出臺和實施,加上之前的《網絡安全法》,我們對數據保護的水平應該是很高的,在國際范圍內基本是這樣。這些法律都要求數據收集、加工、處理、轉移和超范圍使用等獨立地告知用戶且獲得用戶同意,這樣可能會帶來一個新的問題是,用戶會被一個商家不斷地告知是否同意,不厭其煩,反而成了一種新的騷擾。權益的保護可能確實是好事,但好事也有度,法律追求的應該是恰當的保護,保護的平衡,而不是極致的保護,極致的保護只會適得其反。
最近我就發(fā)現,在那些以前上過的網頁再次填寫輸入過的數據時,以前自動顯示曾經輸入內容的變得少了,不得不使用一次就重復輸入一次。信息被記錄的次數少了,安全性可能是提高了,但便捷性卻大幅下降了。
關于功能多樣性。
就拿數據中的個人數據而言,通過多年的觀察,我把個人數據分為五類:個人特征數據、個人記錄數據、復合型數據、個人生物特征數據、功能型個人數據。每一類數據其中蘊含的權利、權利的歸屬和保護的模式可能會有很大的差別,如果簡單套用統一的的模式和規(guī)定,反而會出問題。
第一類說是個人數據,其實是指向個人的數據,個人不一定擁有對這個數據的決定權,這個數據也基本不是我們本人創(chuàng)造的,我們可以稱其為個人特征數據。比如我們的地址、郵箱、電話號碼、身份證信息、銀行賬號、車牌號、信用記錄,等等。這也是我們通常認識上最接近于我們理解的個人數據的一類。其實這些個人數據都是指向你這個物理的肉身的,但這不等于你擁有法律上對這些信息完全的所有權,包括修改、刪除的權利。法律之所以這么規(guī)定,有的是出于保護其他權益的需要,有的是出于公平合理的需要,有的是出于社會管理的需要。
第二類是我們本人創(chuàng)造的數據,這類數據整體上是偏向于知識產權的,我們可以稱其為個人記錄數據。比如我們的聊天記錄,我拍的照片、我寫的文章等。這里面如果夠得上知識產權,如作品等,則與知識產權等權利形成一種競合,如果構不成,則僅僅是作為個人數據處理和保護。
第三類是個人使用有關工具創(chuàng)造的數據,比如騎行共享單車的數據,開車的各種記錄,使用手機和電腦的記錄,等等,這些信息具有一定的客觀性,與個人特征的關聯性最小。我們可以稱其為復合型數據。
第四類是我們的個人生物特征數據,這一類是偏向于人身權的。比如我們的肖像、指紋、聲波、虹膜特征、基因排序等;第五類是功能型個人數據,就是我們設置的密碼、電子簽名等,數據本身是沒有意義的,數據的存在是為了實現某種特定的功能。
這樣分析下來,其實我們對每一類個人數據保護的側重點可能都是不一樣的。對于第一類數據,個人并沒有什么修改權,法律也不應該支持這種修改,除非存在錯誤;而第二類則完全不同,個人擁有完全的修改權,就像我們的微信頭像,我們想換就可以換。對于最后一類數據,我們的密碼等,保護的重點應該是不被披露和關聯,而且應該是強保護;而對于生物特征數據,比如我們的臉部特征等,由于我們每天都在進行自我披露,所以保護的重點則是不被非法收集和濫用。
最后,我們說,不管是什么樣的權利,簡單地談保護往往是沒有意義的,關鍵點和難點在于權利和義務的平衡、權利和權利之間的平衡、保護的度的恰到好處的把握,過猶不及。作為一種十分特殊的,完全脫離我們以前基于實物世界權利認知的,存在于虛擬空間的數據,在這方面就更加特殊。一定不能將你在物理世界里對你的茶杯和現金擁有的所有權的認知簡單地搬到這里來,這也是黃教授的理論出現錯誤的根本原因。
就像我們無法將我們個人數據之一的銀行存款隨意加一個零,不能隨意刪除我們的交通違章記錄一樣,那些趁《個人信息保護法》實施之際鼓吹什么”我的信息我做主”的說法,我只想對他說:“你想多了”。