盡管企業(yè)和消費(fèi)者都對(duì)人工智能改變?nèi)粘I畹臐摿Ω械脚d奮,但人工智能的廣泛使用所帶來(lái)的隱私問(wèn)題仍是一個(gè)主要問(wèn)題。顯然,隨著越來(lái)越多的個(gè)人數(shù)據(jù)被輸入人工智能模型,許多消費(fèi)者理所當(dāng)然地?fù)?dān)心他們的隱私,以及他們的數(shù)據(jù)被如何使用。
本文旨在幫助這些消費(fèi)者建立有關(guān)人工智能隱私功能的更深入的知識(shí)庫(kù)。此外,它還為企業(yè)主和領(lǐng)導(dǎo)者提供了指南,幫助他們更好地了解客戶(hù)的擔(dān)憂(yōu),以及如何在不犧牲功能的情況下保護(hù)隱私的方式使用人工智能。
人工智能和隱私問(wèn)題
很少尊重版權(quán)和知識(shí)產(chǎn)權(quán)法
人工智能模型從網(wǎng)絡(luò)的各個(gè)角落提取訓(xùn)練數(shù)據(jù)。不幸的是,許多人工智能供應(yīng)商在未經(jīng)他人同意的情況下使用他人受版權(quán)保護(hù)的藝術(shù)品、內(nèi)容或其他知識(shí)產(chǎn)權(quán)時(shí),要么沒(méi)有意識(shí)到,要么不在乎。
隨著模型被訓(xùn)練、再訓(xùn)練和使用這些數(shù)據(jù)進(jìn)行微調(diào),這個(gè)問(wèn)題變得越來(lái)越嚴(yán)重,如今的許多人工智能模型都非常復(fù)雜,甚至它們的構(gòu)建者也無(wú)法自信地說(shuō)出,正在使用哪些數(shù)據(jù)以及誰(shuí)可以訪(fǎng)問(wèn)這些數(shù)據(jù)。
未經(jīng)授權(quán)合并用戶(hù)數(shù)據(jù)
當(dāng)人工智能模型用戶(hù)以查詢(xún)的形式輸入自己的數(shù)據(jù)時(shí),這些數(shù)據(jù)有可能成為模型未來(lái)訓(xùn)練數(shù)據(jù)集的一部分。當(dāng)這種情況發(fā)生時(shí),這些數(shù)據(jù)可能作為輸出顯示給其他用戶(hù)的查詢(xún),如果用戶(hù)向系統(tǒng)輸入了敏感數(shù)據(jù),這是一個(gè)特別大的問(wèn)題。
監(jiān)管機(jī)構(gòu)和保障措施有限
一些國(guó)家和監(jiān)管機(jī)構(gòu)正在制定人工智能法規(guī)和安全使用政策,但目前尚無(wú)總體標(biāo)準(zhǔn)來(lái)要求人工智能供應(yīng)商,對(duì)其構(gòu)建和使用人工智能工具的方式負(fù)責(zé)。
許多人工智能供應(yīng)商已經(jīng)因侵犯知識(shí)產(chǎn)權(quán),以及不透明的培訓(xùn)和數(shù)據(jù)收集流程而受到批評(píng)。但目前在大多數(shù)情況下,人工智能供應(yīng)商可以在不受干擾的情況下,決定自己的數(shù)據(jù)存儲(chǔ)、網(wǎng)絡(luò)安全和用戶(hù)規(guī)則。
未經(jīng)授權(quán)使用生物識(shí)別數(shù)據(jù)
越來(lái)越多的個(gè)人設(shè)備使用面部識(shí)別、指紋、語(yǔ)音識(shí)別和其他生物識(shí)別數(shù)據(jù)來(lái)取代更傳統(tǒng)的身份驗(yàn)證形式。公共監(jiān)控設(shè)備也經(jīng)常使用人工智能掃描生物特征數(shù)據(jù),以便更快地識(shí)別個(gè)人。
雖然這些新的生物識(shí)別安全工具非常方便,但對(duì)于人工智能企業(yè)在收集到這些數(shù)據(jù)后如何使用這些數(shù)據(jù)的監(jiān)管有限。在許多情況下,個(gè)人甚至不知道他們的生物特征數(shù)據(jù)已經(jīng)被收集,更不用說(shuō)這些數(shù)據(jù)被存儲(chǔ)并用于其他目的了。
隱蔽元數(shù)據(jù)收集實(shí)踐
當(dāng)用戶(hù)與廣告、社交媒體視頻或幾乎任何網(wǎng)絡(luò)資產(chǎn)進(jìn)行交互時(shí),來(lái)自該交互的元數(shù)據(jù)以及用戶(hù)的搜索歷史和興趣可以被存儲(chǔ)起來(lái),以便將來(lái)進(jìn)行更精確的內(nèi)容定位。
這種元數(shù)據(jù)收集方法已經(jīng)持續(xù)多年,但在人工智能的幫助下,可以大規(guī)模收集和解釋更多數(shù)據(jù),使科技企業(yè)有可能在用戶(hù)不知道其工作原理的情況下,進(jìn)一步針對(duì)他們的信息。雖然大多數(shù)用戶(hù)網(wǎng)站都有提及這些數(shù)據(jù)收集做法的政策,但只是在其他政策文本中簡(jiǎn)短提及,因此大多數(shù)用戶(hù)沒(méi)有意識(shí)到他們已經(jīng)同意了什么,并將自己和移動(dòng)設(shè)備上的所有內(nèi)容置于審查之下。
人工智能模型的內(nèi)置安全功能有限
雖然一些人工智能供應(yīng)商可能選擇構(gòu)建基線(xiàn)網(wǎng)絡(luò)安全功能和保護(hù),但許多人工智能模型沒(méi)有本地網(wǎng)絡(luò)安全保障措施。這使得未經(jīng)授權(quán)的用戶(hù)和惡意行為者,非常容易訪(fǎng)問(wèn)和使用其他用戶(hù)的數(shù)據(jù),包括個(gè)人身份信息(PII)。
延長(zhǎng)數(shù)據(jù)存儲(chǔ)周期
很少有人工智能供應(yīng)商能夠公開(kāi)他們存儲(chǔ)用戶(hù)數(shù)據(jù)的時(shí)間、地點(diǎn)和原因,而透明的供應(yīng)商通常會(huì)存儲(chǔ)很長(zhǎng)一段時(shí)間的數(shù)據(jù)。
例如,OpenAI的政策稱(chēng),它可以將用戶(hù)輸入和輸出數(shù)據(jù)存儲(chǔ)長(zhǎng)達(dá)30天,以識(shí)別濫用行為。然而,目前尚不清楚該企業(yè)何時(shí)或如何在用戶(hù)不知情的情況下更仔細(xì)地查看他們的個(gè)人數(shù)據(jù)。
隱私和人工智能數(shù)據(jù)的收集
網(wǎng)絡(luò)抓取和網(wǎng)絡(luò)爬行
由于它不需要特殊權(quán)限,并且使供應(yīng)商能夠收集大量不同的數(shù)據(jù),因此人工智能工具通常依賴(lài)于網(wǎng)絡(luò)抓取和網(wǎng)絡(luò)爬行來(lái)構(gòu)建訓(xùn)練數(shù)據(jù)集。
內(nèi)容是從互聯(lián)網(wǎng)上的公開(kāi)來(lái)源中抓取的,包括第三方網(wǎng)站、維基百科、數(shù)字圖書(shū)館等。近年來(lái),用戶(hù)元數(shù)據(jù)也成為通過(guò)網(wǎng)絡(luò)抓取和爬行收集的大部分內(nèi)容。這些元數(shù)據(jù)通常來(lái)自營(yíng)銷(xiāo)和廣告數(shù)據(jù)集,以及包含目標(biāo)受眾和他們最關(guān)注的內(nèi)容的網(wǎng)站。
人工智能模型中的用戶(hù)查詢(xún)
當(dāng)用戶(hù)將他們的問(wèn)題或其他數(shù)據(jù)輸入人工智能模型時(shí),大多數(shù)人工智能模型都會(huì)將該數(shù)據(jù)存儲(chǔ)至少幾天。雖然這些數(shù)據(jù)可能永遠(yuǎn)不會(huì)用于其他用途,但事實(shí)證明,許多人工智能工具不僅會(huì)收集這些數(shù)據(jù),還會(huì)保留這些數(shù)據(jù)以供未來(lái)的培訓(xùn)使用。
生物識(shí)別技術(shù)
監(jiān)控設(shè)備,包括安全攝像頭、面部和指紋掃描儀以及檢測(cè)人類(lèi)聲音的麥克風(fēng),都可以用來(lái)收集生物識(shí)別數(shù)據(jù),并在人類(lèi)不知情或未經(jīng)同意的情況下識(shí)別其身份。
許多企業(yè)在使用此類(lèi)技術(shù)時(shí)需要保持多大的透明度的規(guī)定越來(lái)越嚴(yán)格。但在大多數(shù)情況下,他們可以收集、存儲(chǔ)和使用這些數(shù)據(jù),而無(wú)需征求客戶(hù)的許可。
物聯(lián)網(wǎng)傳感器和設(shè)備
物聯(lián)網(wǎng)(IoT)傳感器和邊緣計(jì)算系統(tǒng)收集大量實(shí)時(shí)數(shù)據(jù),并在附近處理這些數(shù)據(jù),以完成更大、更快的計(jì)算任務(wù)。人工智能軟件通常利用物聯(lián)網(wǎng)系統(tǒng)的數(shù)據(jù)庫(kù),并通過(guò)數(shù)據(jù)學(xué)習(xí)、數(shù)據(jù)攝取、安全物聯(lián)網(wǎng)協(xié)議和網(wǎng)關(guān)以及api等方法收集相關(guān)數(shù)據(jù)。
API
API為用戶(hù)提供了與不同類(lèi)型商業(yè)軟件的接口,以便他們可以輕松收集并集成不同類(lèi)型的數(shù)據(jù),以進(jìn)行人工智能分析和訓(xùn)練。通過(guò)正確的API和設(shè)置,用戶(hù)可以從CRM、數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)以及基于云的系統(tǒng)和本地系統(tǒng)收集數(shù)據(jù)。
公共記錄
無(wú)論記錄是否數(shù)字化,公共記錄通常都會(huì)被收集并納入人工智能訓(xùn)練集中。有關(guān)上市企業(yè)、當(dāng)前和歷史事件、犯罪和移民記錄以及其他公共信息的信息無(wú)需事先授權(quán)即可收集。
用戶(hù)調(diào)查和問(wèn)卷
盡管這種數(shù)據(jù)收集方法比較過(guò)時(shí),但使用調(diào)查和問(wèn)卷仍然是人工智能供應(yīng)商從用戶(hù)那里收集數(shù)據(jù)的可靠方法。
用戶(hù)可以回答關(guān)于他們最感興趣的內(nèi)容、所需要幫助的內(nèi)容、以及最近對(duì)產(chǎn)品或服務(wù)的體驗(yàn)如何,或者任何其他問(wèn)題,這些問(wèn)題可以讓人工智能更好地了解如何在未來(lái)與該人進(jìn)行個(gè)性化互動(dòng)。
人工智能和隱私問(wèn)題的解決方案
借助一些最佳實(shí)踐、工具和其他資源,企業(yè)可以有效地使用人工智能解決方案,而無(wú)需犧牲用戶(hù)隱私。為了在人工智能使用的各個(gè)階段保護(hù)最敏感的數(shù)據(jù),請(qǐng)遵循以下提示:
為人工智能制定適當(dāng)?shù)氖褂谜撸簝?nèi)部用戶(hù)應(yīng)該知道他們可以使用哪些數(shù)據(jù),以及在使用人工智能工具時(shí),應(yīng)該如何以及何時(shí)使用這些數(shù)據(jù),這對(duì)于處理敏感客戶(hù)數(shù)據(jù)的企業(yè)尤其重要。
投資數(shù)據(jù)治理和安全工具:保護(hù)人工智能工具和其他攻擊面的一些最佳解決方案,包括擴(kuò)展檢測(cè)和響應(yīng)(XDR)、數(shù)據(jù)丟失防護(hù)以及威脅情報(bào)和監(jiān)控軟件。還有許多特定于數(shù)據(jù)治理的工具,可以幫助保護(hù)數(shù)據(jù)并確保所有數(shù)據(jù)的使用均符合相關(guān)法規(guī)。
閱讀細(xì)則:人工智能供應(yīng)商通常會(huì)提供某種文檔,涵蓋其產(chǎn)品的工作原理以及培訓(xùn)的基礎(chǔ)知識(shí)。仔細(xì)閱讀這些文件,找出任何危險(xiǎn)信號(hào),如果有什么你不確定的,或者在他們的政策文件中有不清楚的地方,聯(lián)系他們的代表來(lái)澄清。
僅使用非敏感數(shù)據(jù):作為一般規(guī)則,不要在任何人工智能工具中輸入企業(yè)或客戶(hù)最敏感的數(shù)據(jù),即使它是一個(gè)定制或微調(diào)的感覺(jué)私密的解決方案。如果想要追求涉及敏感數(shù)據(jù)的特定用例,請(qǐng)研究是否有一種方法可以使用數(shù)字孿生、數(shù)據(jù)匿名化或合成數(shù)據(jù)安全地完成操作。
總結(jié)
人工智能工具為企業(yè)和日常消費(fèi)者提供了各種新的便利,從任務(wù)自動(dòng)化到引導(dǎo)式問(wèn)答,再到產(chǎn)品設(shè)計(jì)和編程。但盡管這些工具可以簡(jiǎn)化我們的生活,但它們也存在侵犯?jìng)€(gè)人隱私的風(fēng)險(xiǎn),從而損害供應(yīng)商聲譽(yù)和消費(fèi)者信任、網(wǎng)絡(luò)安全和監(jiān)管合規(guī)性。
以負(fù)責(zé)任的方式使用人工智能來(lái)保護(hù)用戶(hù)隱私需要付出額外的努力,但當(dāng)考慮到隱私侵犯會(huì)如何影響企業(yè)的公眾形象時(shí),這是非常值得的。尤其是隨著這項(xiàng)技術(shù)的成熟,并在我們的日常生活中變得更加普遍,遵循人工智能法律的通過(guò)并開(kāi)發(fā)更具體的、符合企業(yè)文化和客戶(hù)隱私期望的人工智能,使用最佳實(shí)踐將變得至關(guān)重要。