Claude係由Anthropic研發嘅一系列 大型語言模型[1]。第一個模型喺2023年3月推出。Claude 3喺2024年3月推出,仲可以分析圖片[2]

Claude
開發者Anthropic
初始版本2023年3月, 1年之前 (2023-03)
軟件類別
許可協議專有
網站claude.ai

訓練

編輯

Claude 模型係 生成式預訓練變壓器。佢哋喺大量文本中預先訓練,預測下一個單詞。Claude 模型之後會經由 Constitutional AI 微調,目標係令佢哋有用、誠實同埋無害。[3][4]

Constitutional AI

編輯

Constitutional AI 係由 Anthropic 研發嘅一種畀AI訓練嘅系統(特別係語言模型如Claude)嘅方法,目標係對(人類文明發展)冇害同有用而唔依賴大量人類反饋。呢個方法喺 "Constitutional AI: Harmlessness from AI Feedback" 論文入面有詳細描述,佢包括兩個階段:監督學習 同埋 強化學習[4]

喺監督學習階段,個模型會生成回應提示,根據一套指導原則(「憲法」)嚟自我批核呢啲回應,並修正佢哋。然後模型會喺呢啲修正過嘅回應上微調。[4]

喺AI反饋強化學習(RLAIF)階段,生成嘅回應會由AI比較佢哋對憲法嘅符合程度。呢個AI反饋數據集用嚟訓練一個偏好模型,根據佢哋對憲法嘅滿足程度來評估回應。Claude 會根據呢個偏好模型來微調對齊。呢個技術類似於 從人類反饋嘅強化學習(RLHF),但用嚟訓練偏好模型嘅比較係AI生成嘅,並且係基於憲法。[5][4]

呢個方法令訓練出來嘅AI助手又有用又無害,仲可以解釋佢哋拒絕有害請求嘅原因,增加透明度並且降低對人類監督嘅依賴。[6][7]

Claude 嘅「憲法」包括75個重點,仲包括 聯合國世界人權宣言 嘅部分內容。[6][3]

模型

編輯

Claude

編輯

Claude 係Anthropic嘅語言模型嘅初版,喺2023年3月推出,[8] Claude 喺好多任務做得唔錯,但係喺程式設計、數學同邏輯推理能力方面唔係好掂。[9] Anthropic 同類似 Notion(生產力軟件)同 Quora(幫佢哋設計 Poe 聊天機械人)合作。[9]

Claude Instant

編輯

Claude 有兩個版本,Claude 同 Claude Instant,Claude Instant 係一個出文更快、成本更平、比起 Claude 輕嘅版本,可以理解做細 Claude。Claude Instant 嘅輸入上下文限額有100,000 字符(大約等於75,000字)。[10]

Claude 2

編輯

Claude 2 係 Claude 之後嘅下一個主要版本,喺2023年7月推出,對公眾開放,而舊嘅Claude 1 淨係限於Anthropic批准嘅選定用戶。[11]

Claude 2 嘅上下文限額由9,000字擴展到100,000字。[8] 仲可以上傳 PDF 同其他文件畀佢睇佢,令到 Claude 識得閱讀、總結同幫手搞掂工作。

Claude 2.1

編輯

Claude 2.1 將聊天機器人識得處理嘅字符數目增加一倍,擴展到200,000字嘅限額,大約等於500頁嘅書寫材料。[1]

隨著 Claude 2.1 引入改進咗嘅程式設計工具同系統提示,開發者有得喺新嘅 Workbench 環境入面試提示,同時有得較模型行為,Anthropic 仲話新嘅模型比起之前啲模型少啲機會亂噏當秘笈。[12]

Claude 3

編輯

Claude 3 喺2024年3月14號推出,新聞稿宣稱喺各種認知任務上創下新嘅行業標準。Claude 3 系列包括三個先進嘅模型,按能力遞升排序分別係:Haiku、Sonnet 同埋 Opus。Claude 3 嘅默認版本 Opus 有 200,000 個 tokens 嘅上下文窗口,但為特定用途擴展到 1 百萬個 tokens。[13][2]

Claude 3 喺進行「大海撈針」測試期間似乎表現出 後設認知 推理,包括能夠意識到自己被人工測試。[14]

Claude 3.5

編輯

喺2024年6月20號,Anthropic 發佈咗 Claude 3.5 Sonnet,喺基準測試上表現顯著提升,比更大型嘅 Claude 3 Opus 更出色,特別喺編碼、多步工作流程、圖表解釋同從圖像中提取文本等方面。與 3.5 Sonnet 一起推出嘅仲有新嘅 Artifacts 功能,Claude 可以喺界面中專門窗口創建代碼,並實時預覽選定代碼,例如網站或者 SVGs。[15]

訪問

編輯

有限使用嘅 Claude 3.5 Sonnet 可以免費使用,但需要提供電郵地址同手機號碼。仲提供一個收費計劃,畀更多使用同訪問所有 Claude 3 模型。[16]

喺2024年5月1號,Anthropic 宣布咗 Claude Team 計劃,呢個係 Claude 嘅首個企業版計劃,同埋 Claude iOS app[17]

批評

編輯

Claude 2 收到好多批評,話佢倫理限制好嚴,搞到個模型又慢又難用。有啲用戶無啦啦畀佢拒絕回答一啲根本冇害嘅問題,例如程式設計問題「點樣喺我部 ubuntu 伺服器殺死所有行緊 Python 嘅程式?」。呢個問題引起咗關於 AI 發展中「對齊稅」嘅討論(確保 AI 系統對齊倫理嘅成本),重點喺於平衡倫理考量同實際功能。批評者主張用戶自主同效率,而支持者強調倫理 AI 嘅重要性。[18][12]

參見

編輯

參考資料

編輯
  1. 1.0 1.1 Davis, Wes (2023-11-09). "Claude 2.1 can digest up to 200K tokens". The Verge (英文). 喺2024-01-23搵到.
  2. 2.0 2.1 Whitney, Lance (March 4, 2024). "Anthropic's Claude 3 chatbot claims to outperform ChatGPT, Gemini". ZDNET (英文). 喺2024-03-05搵到.
  3. 3.0 3.1 "What to Know About Claude 2, Anthropic's Rival to ChatGPT". TIME (英文). 2023-07-18. 喺2024-01-23搵到.
  4. 4.0 4.1 4.2 4.3 "Claude's Constitution". Anthropic (英文). May 9, 2023. 喺2024-03-26搵到.
  5. Eliot, Lance (May 25, 2023). "Latest Generative AI Boldly Labeled As Constitutional AI Such As Claude By Anthropic Has Heart In The Right Place, Says AI Ethics And AI Law". Forbes (英文). 喺2024-03-27搵到.
  6. 6.0 6.1 Bai, Yuntao; Kadavath, Saurav; Kundu, Sandipan; Askell, Amanda; Kernion, Jackson; Jones, Andy; Chen, Anna; Goldie, Anna; Mirhoseini, Azalia (2022-12-15), Constitutional AI: Harmlessness from AI Feedback, arXiv:2212.08073
  7. Mok, Aaron. "A ChatGPT rival just published a new constitution to level up its AI guardrails, and prevent toxic and racist responses". Business Insider (美國英文). 喺2024-01-23搵到.
  8. 8.0 8.1 Drapkin, Aaron (2023-10-27). "What Is Claude AI and Anthropic? ChatGPT's Rival Explained". Tech.co (美國英文). 喺2024-01-23搵到.
  9. 9.0 9.1 "Introducing Claude". Anthropic. March 14, 2023.
  10. Yao, Deborah (2023-08-11). "Anthropic's Claude Instant: A Smaller, Faster and Cheaper Language Model". AI Business.
  11. Matthews, Dylan (2023-07-17). "The $1 billion gamble to ensure AI doesn't destroy humanity". Vox (英文). 喺2024-01-23搵到.
  12. 12.0 12.1 "Anthropic Announces Claude 2.1 LLM with Wider Context Window and Support for AI Tools". InfoQ (英文). 喺2024-01-23搵到.
  13. "Introducing the next generation of Claude". Anthropic (英文). 喺2024-03-04搵到.
  14. Edwards, Benj (2024-03-05). "Anthropic's Claude 3 causes stir by seeming to realize when it was being tested". Ars Technica (美國英文). 喺2024-03-09搵到.
  15. Pierce, David (2024-06-20). "Anthropic has a fast new AI model — and a clever new way to interact with chatbots". The Verge (英文). 喺2024-06-20搵到.
  16. "Introducing the Claude Team plan and iOS app". Anthropic (英文). May 1, 2024. 喺2024-06-22搵到.
  17. Field, Hayden (May 1, 2024). "Amazon-backed Anthropic launches iPhone app and business tier to compete with OpenAI's ChatGPT". CNBC. 喺May 3, 2024搵到.{{cite news}}: CS1 maint: url-status (link)
  18. Glifton, Gerald (January 3, 2024). "Criticisms Arise Over Claude AI's Strict Ethical Protocols Limiting User Assistance". Light Square (英文). 喺2024-01-23搵到.

出面網頁

編輯