在人工智能(AI)深刻重塑知識生產與組織方式的時代,圖書館界面臨著一場前所未有的變革。各類 AI 工具正以前所未有的速度滲透到元數據創建的各個環節,然而,業界普遍缺乏一個統一的、體系化的框架來評估、部署和管理人機協作的複雜模式。這種理論的缺失導致實踐中的探索往往是零散的、缺乏戰略指導的。為應對這一挑戰,本文提出一個名為 “圖書館元數據創建量表”(Library Metadata Creation Scale - LMCS)的全新概念模型,旨在為這場變革提供一個清晰的分析坐標。
一、 LMCS 框架的提出#
生成式人工智能(Generative AI)的崛起,給圖書館元數據領域帶來了範式級的衝擊。它既預示著前所未有的效率提升與服務創新的可能性,也同時引發了業界對於元數據質量、學術誠信及專業角色定位的深刻憂慮。在實踐中,圍繞 AI 工具的討論往往迅速陷入一種兩極化的困境:要麼是堅守傳統、拒絕任何 AI 介入的 “全手動” 模式,要麼是擁抱技術、追求極致效率的 “全自動” 願景。這種非此即彼的二元對立,不僅無助於解決現實問題,反而加劇了從業者的焦慮與決策的混亂。
“圖書館元數據創建量表”(LMCS)正是在這一背景下被構想和提出的。其核心目的在於超越 “允許或禁止” 的簡單化論斷,為圖書館界提供一個更精細、更具操作性的結構化框架。該框架旨在為管理者、編目員和技術開發者提供一種通用語言,用以清晰地定義和溝通在不同場景下人機協作的邊界、模式與責任。其理論構建主要基於以下幾點考量:
- 回應實踐中的 “二元困境”,倡導精細化治理:LMCS 的誕生,首先是對當前行業討論中簡單二元論的直接回應。它認識到,將 AI 視為一個單一、同質化的概念是錯誤的。相反,AI 在元數據創建中的應用是一個連續的光譜。LMCS 試圖將這個光譜解構為五個清晰、可管理的等級,其設計理念從一個初步的 “紅綠燈” 模型(如 “禁止 AI”、“部分允許”、“完全允許”)演化而來,最終形成一個更具指導性的分級體系。這使得圖書館可以根據資源類型、重要性及處理目標,進行差異化的策略選擇,而非一刀切。
- 借鑒技術整合的歷史經驗,提供前瞻性路徑:縱觀歷史,每一項顛覆性技術 —— 從複印機、計算機到互聯網 —— 在被圖書館接納之初,都曾被視為對傳統技能和工作流程的威脅。然而,這些技術最終都找到了與專業實踐相融合的路徑,並成為不可或缺的基礎設施。LMCS 借鑒了這一歷史視角,認為與其被動地抵制或倉促地接納,不如主動地設計一個循序漸進、權責分明的整合路徑。它為 AI 工具從輔助性的 “諮詢顧問”(2 級)到深度的 “合作夥伴”(4-5 級)的演進,提供了可預期的發展階梯。
- 調和行業內在的理論張力,實現理論自洽:LMCS 框架深度植根於圖書館編目領域百年來持續存在的理論辯論中。它試圖系統性地調和兩種核心價值追求:一方面,是以查爾斯・阿米・卡特(Charles Ammi Cutter)為代表的、追求單條記錄盡善盡美的 “規範理想”(對應 LMCS 的 1-2 級);另一方面,是為了應對海量信息而興起的、強調 “可用性優先” 的現實主義原則,如檔案館界的 “多產出,少流程”(MPLP)思想(對應 LMCS 的 3-5 級)。LMCS 並非要評判孰優孰劣,而是承認這兩種理論在不同情境下的並存價值,並為其在統一的戰略框架下共存提供了可能。
綜上所述,LMCS 旨在成為一個集診斷、規劃與溝通功能於一體的戰略工具。它不僅為當前的實踐提供指導,更重要的是,它試圖將關於 AI 的討論從一種以 “威脅” 和 “替代” 为核心的防禦性話語,重塑為一種以 “協同”、“增強” 和 “職業演進” 为核心的建設性對話。
該量表將元數據創建中的人機協作模式,從完全依賴人類智力到完全由機器自主運行,劃分為五個遞進的等級。
等級 (Level) | 名稱 (Name) | 核心描述 (Core Description) | 關鍵要求與編目員責任 (Key Requirements & Librarian's Responsibility) | 典型應用場景 (Typical Application Scenarios) |
---|---|---|---|---|
1 | 人工原始編目 (Original Cataloging) | 元數據記錄完全由編目員手動創建,不使用任何 AI 生成工具。編目員依賴 RDA、MARC21、LCSH 等傳統工具和標準。 | 編目員對記錄的每一個字段的準確性、完整性和合規性負全部責任。 這是傳統編目工作的基準。 | - 為獨特館藏(如手稿、檔案、學位論文)進行原始編目。 - 創建國家書目或權威機構的高標準 “黃金” 記錄。 - 培訓新編目員掌握編目基礎規則和思維。 |
2 | AI 輔助建議 (AI-Assisted Suggestion) | AI 作為諮詢工具,為特定字段提供建議或選項,但不直接生成完整記錄。 | 編目員負責批判性地評估所有 AI 建議,做出最終選擇,並手動完成記錄。 AI 是輔助思考的工具,編目員仍是記錄的唯一創作者。 | - AI 根據題名、摘要或全文推薦主題詞(LCSH/FAST)或分類號(DDC/LCC)。 - AI 從文本中提取可能的關鍵詞或實體(人名、地名)。 - AI 建議適用的 MARC 字段標籤。 |
3 | AI 輔助增強與清理 (AI-Assisted Enhancement & Cleanup) | AI 對一個已存在的、不完整的或低質量的記錄(如供應商記錄、簡編記錄)進行增強、修正或格式化。 | 編目員提供初始記錄,並必須審查 AI 的所有修改,確保其準確性、未改變核心語義,並符合本地政策。 編目員的角色是 “編輯” 和 “校對者”。 | - 自動校正 MARC 記錄中的標點符號和子字段代碼。 - 根據權威文檔(如 VIAF)自動規範化人名、團體名稱。 - 自動將縮寫詞展開或將摘要翻譯成另一種語言。 - 豐富記錄,如根據內容自動添加內容附註(505 字段)。 |
4 | 機器生成記錄,人工審核 (Machine-Generated Record, Human Review) | AI 根據資源本身(如掃描的文本、PDF 文件、音視頻)自動生成一個完整的、待審核的元數據記錄。 | 編目員的核心職責從 “創建” 轉變為 “審核與驗證”。 必須仔細檢查 AI 生成的初步記錄,修正錯誤、補充遺漏,並最終批准。這是人機協作的主要模式。 | - 對大批量電子書或期刊文章進行快速編目,AI 自動提取作者、標題、ISBN、摘要等。 - 為數字化圖像集合自動生成描述性元數據(如識別圖像內容、提取 EXIF 數據)。 - 將非結構化的書目信息(如參考文獻列表)轉換為結構化的 MARC 記錄。 |
5 | 全自動元數據生成 (Fully Automated Metadata Generation) | AI 自主完成元數據的創建、驗證和入庫流程,僅在遇到無法處理的異常或置信度低的情況時才觸發人工干預。 | 編目員的角色轉變為 “系統管理者” 和 “質量監控者”。 負責配置 AI 規則、監控系統整體性能、定期抽樣審計記錄質量,並處理 AI 上報的疑難問題。 | - 實時處理大規模的出版商數據流或開放獲取資源庫,自動生成元數據並加載到發現系統。 - 為機構知識庫中的提交內容(如預印本)自動創建元數據記錄。 - 對用戶生成內容(如照片、視頻)進行自動標籤和分類。 |
二、討論#
LMCS 的價值遠不止於其作為操作指南的實用性,更在於它是一個理論棱鏡,折射並試圖調和圖書館專業內部長期存在的根本性張力,並由此推導出一條邏輯嚴謹的職業重塑路徑。
LMCS 的五個等級,並非簡單的技術階梯,而是對圖書館編目史上核心理論辯論的系統化編碼與回應。這場辯論的核心,始終圍繞著 “規範理想” 與 “效率現實” 之間的張力。
-
“規範理想” 的傳承與限定:LMCS 的 1-2 級,是查爾斯・阿米・卡特(Charles Ammi Cutter)“書目對象”(Bibliographic Objectives)原則在當代的直接體現。它追求為每一份資源創造一份盡善盡美的記錄,強調人類智力在語義理解、知識關聯和權威控制中的核心作用。這種 “工匠精神” 是圖書館專業性的基石,確保了核心館藏和高價值知識資產的深度揭示。然而,LMCS 框架也清醒地認識到,將此理想應用於所有資源,在信息爆炸時代既不現實也無必要。它通過將這種模式限定在特定場景(如珍本、手稿),從而保護了其價值,避免了其被無限泛化而導致的體系崩潰。
-
“效率現實” 的整合與升華:LMCS 的 3-5 級,則吸收並發展了檔案館界 “多產出,少流程”(More Product, Less Process, MPLP)的現實主義思想。MPLP 承認,對於海量積壓的館藏,“足夠好” 的元數據遠勝於沒有元數據。LMCS 將這一原則從一種應對積壓的權宜之計,提升為一種主動的、分級的戰略選擇。它不再是 “完美” 的對立面,而是構成了一個與 “完美” 互補的、服務於不同信息發現需求的策略組合。
更重要的是,LMCS 標誌著一個根本性的理論轉變:從 “書目控制”(Bibliographic Control)走向 “書目治理”(Bibliographic Governance)。傳統的 “書目控制” 強調的是一種中心化的、由機構主導的、對單條記錄的權威性生產與把關。而在 LMCS 框架下,圖書館的角色轉變為一個元數據生態系統的 “治理者”。“治理” 意味著:圖書館不再是所有元數據的唯一生產者,而是人、機器、供應商、甚至是用戶生成內容等多元生產主體的協調者。其核心任務從 “創建” 轉變為設計和監督一個可信的、質量可控的、人機協同的元數據生產體系。這是一種更高維度的控制,一種基於規則、策略和質量審計的系統性治理。
基於上述理論辨析,LMCS 為圖書館員的職業演進描繪了一條清晰的實踐路徑,其本質是一場深刻的 “專業管轄權”(Professional Jurisdiction)轉移,並可能催生組織形態與服務範式的變革。
- 專業管轄權的轉移與技能重構:傳統編目員的核心管轄權在於對編目規則的精湛詮釋和手動應用。而在 LMCS 的高級別模式中,機器承擔了大部分規則應用的工作,圖書館員的新核心管轄權在於對自動化流程的 “設計、驗證與倫理監督”。工作的重心從 “生產線上的工匠”,轉變為知識體系的 “架構師”。這種演進要求技能棧發生系統性重構:
- 在 1-2 級,價值體現在深厚的目錄學、主題法、分類法等內容知識(Content Knowledge)。
- 在 3-4 級,價值體現在數據評估、模式識別、人機交互效率等過程知識(Process Knowledge)。
- 在 5 級,價值則體現在系統思維、數據分析、策略規劃和倫理決策等元知識(Metacognitive Knowledge)。
- 組織架構的必然變革:專業管轄權的轉移必然衝擊傳統的、基於同質化任務的部門結構。全面採納 LMCS 的圖書館,其技術服務部門將從單一的 “編目部” 演化為一個功能分化的 “元數據策略中心”。該中心可能包含:
- 特藏與原始編目組(主攻 1-2 級):由資深專家組成,負責處理獨特、複雜、高價值的館藏,傳承專業核心技藝。
- 批量處理與數據增強組(主攻 3-4 級):人機協作的主力軍,負責大規模數字與實體資源的處理,強調效率與質量的平衡。
- 元數據系統與策略組(主攻 5 級):負責制定全館元數據政策、評估與配置 AI 工具、監控自動化流程的質量與倫理合規性,是整個體系的 “大腦”。
- “元數據即服務”(MaaS)概念的擴展:組織架構的變革,使元數據部門有能力從一個內部生產單位,轉變為一個面向內外部用戶的 “服務提供商”。在 AI 能力的加持下,“元數據即服務”(Metadata-as-a-Service)的內涵得以極大擴展。例如,可以為本校研究人員提供 “按需元數據生成” 服務,快速處理他們的研究數據集;或利用 AI 進行大規模元數據分析,為學科服務提供決策支持;甚至可以向缺乏技術能力的小型文化機構提供元數據清理與增強的諮詢服務,從而拓展圖書館的社會價值。
這種演進預示著技術服務部門的組織變革,即從一個基於任務同質化的 “生產線” 模式,轉變為一個基於 LMCS 等級和資源類型的 “項目組合管理”(Portfolio Management)模式。不同的團隊將專注於不同的 LMCS 層級,形成一個由 “特藏編目專家”(1-2 級)、“數據增強與質量控制團隊”(3-4 級)和 “元數據策略與系統分析師”(5 級)組成的、功能互補的專業生態。
三、批判性審視#
作為一個理論模型,LMCS 的優雅簡潔背後也潛藏著值得警惕的風險。一種批判性的審視揭示了其在實踐中可能面臨的四大核心挑戰。
- “線性進步” 的幻覺:將五個等級視為從 “落後” 到 “先進” 的進化階梯,是一種危險的技術決定論。我們必須強調,LMCS 是一個適用於不同情境的 “診斷工具箱”,而非一個必須達成的 “進化目標”。對於一份中世紀手稿,1 級永遠是比 5 級更 “先進”、更合適的選擇。工作的價值不應由自動化程度來定義,否則將導致對專業判斷和 “工匠精神” 的貶低,侵蝕圖書館的核心價值。
- “算法黑箱” 的倫理危機:高級別的自動化嚴重依賴 AI 模型,而這些模型在訓練數據上可能存在系統性的偏見(如語言、文化、地域偏見)。當圖書館員的角色從 “創作者” 轉變為 “審核者” 時,他們識別和糾正這些深植於算法內部的、更為隱蔽的認識論偏見的能力是否會隨之減弱?這不僅是技術問題,更是關乎知識公平(Knowledge Equity)和認識論正義(Epistemic Justice)的倫理危機,直接挑戰圖書館作為中立、包容的知識守護者的社會承諾。
- 專業技能的 “空心化” 風險:如果新一代圖書館員長期在 3-4 級的環境中工作,缺乏在 1-2 級模式下的系統訓練,他們可能 “知其然,而不知其所以然”,無法深入掌握支撐整個專業大廈的底層邏輯和複雜規則。當 AI 出錯時,他們可能無法進行根本性的修正。長此以往,這可能導致專業技能的代際流失,最終使我們在與機器的協同中喪失知識主導權和專業權威,從 “架構師” 淪為 “維修工”。
- 加劇新的 “數字鴻溝”:高質量的 AI 編目工具和服務,無論是商業採購還是自主研發,都需要巨大的資金和技術投入。這極有可能在圖書館界內部創造一個新的鴻溝。資金雄厚的大學圖書館可以輕鬆實現 4-5 級的高效自動化,而經費緊張的公共圖書館或地方性機構可能仍停留在 1-2 級。這種 “元數據生產力的分化” 將直接導致信息資源揭示水平的巨大差異,最終演變為服務質量和用戶訪問權的鴻溝,與圖書館促進信息公平的根本使命背道而馳。
結語#
“圖書館元數據創建量表”(LMCS)為我們提供了一個審視和導航 AI 時代元數據實踐的有力工具。但它更重要的意義在於,它迫使我們直面行業的核心矛盾,並重新思考圖書館員的專業價值。
未來的道路並非在 “全手動” 和 “全自動” 之間做出二元選擇。真正的挑戰在於,圖書館員能否超越單純的規則執行者,成為人機協同系統的批判性設計者和倫理守護者。這意味著,我們既要擁抱自動化帶來的效率,更要捍衛深思熟慮的人類判斷、維護知識表述的公平性,並確保專業智慧在新的技術生態中得以傳承和升華。唯有如此,我們才能在智能時代,真正駕馭技術,而非被技術所定義。