Close Menu
    What's Hot

    Avatar: Fire and Ash chốt ngày phát hành trên Disney+

    13 Tháng 5, 2026

    Apple phát triển AirPods Pro tích hợp Camera: Bước đột phá mới cho AI

    13 Tháng 5, 2026

    Microsoft bảo vệ tính năng tăng xung nhịp CPU để cứu vãn hiệu năng Windows 11

    13 Tháng 5, 2026

    Subscribe to Updates

    Get the latest creative news from FooBar about art, design and business.

    Facebook X (Twitter) Instagram
    Xu Hướng SốXu Hướng Số
    • AI News
      1. ChatGPT
      2. Claude
      3. Gemini
      4. Open AI
      5. View All

      OpenAI đưa khả năng suy luận GPT-5 vào giọng nói thời gian thực và điều này thay đổi hoàn toàn những gì voice agent có thể làm

      11 Tháng 5, 2026

      Gặp lại “phiên bản nhí” của chính mình: Trào lưu ảnh AI gây xúc động mạnh nhờ ChatGPT Images 2.0

      7 Tháng 5, 2026

      “Goblingate” – khi ChatGPT bị ám ảnh bởi yêu tinh và bài học đắt giá về huấn luyện AI

      4 Tháng 5, 2026

      Tubi trở thành nền tảng streaming đầu tiên ra mắt ứng dụng gốc ngay trong ChatGPT

      8 Tháng 4, 2026

      Claude, OpenClaw và thực tại mới: Đặc vụ AI đã tới, sự hỗn loạn cũng bắt đầu

      9 Tháng 4, 2026

      JPMorgan theo dõi việc sử dụng AI của nhân viên tại nơi làm việc: Những điều bạn cần biết

      12 Tháng 3, 2026

      Có nên nhờ ChatGPT và Gemini chọn cho mình bộ máy chơi game?

      29 Tháng 4, 2026

      Sổ tay mới của Gemini là gì? Mẹo sử dụng tính năng Sổ tay mới của Gemini

      29 Tháng 4, 2026

      Cách sử dụng Notebooks trong Gemini với NotebookLM 2026: hướng dẫn từng bước đầy đủ

      12 Tháng 4, 2026

      OpenAI ra mắt Daybreak: Biến AI thành lớp phòng thủ mạng chủ động ngay trong vòng đời phát triển phần mềm

      12 Tháng 5, 2026

      OpenAI đưa khả năng suy luận GPT-5 vào giọng nói thời gian thực và điều này thay đổi hoàn toàn những gì voice agent có thể làm

      11 Tháng 5, 2026

      Sam Altman công bố “Our Principles” – OpenAI đang viết lại sứ mệnh của chính mình

      3 Tháng 5, 2026

      Google ra mắt Deep Research và Deep Research Max

      25 Tháng 4, 2026

      LLM là gì? Cách các mô hình ngôn ngữ lớn hoạt động

      13 Tháng 5, 2026

      OpenAI ra mắt Daybreak: Biến AI thành lớp phòng thủ mạng chủ động ngay trong vòng đời phát triển phần mềm

      12 Tháng 5, 2026

      Anthropic ra mắt Agent View cho Claude Code: Trung tâm điều khiển đa tác nhân ngay trên dòng lệnh

      12 Tháng 5, 2026

      Đánh giá ChatGPT Plus (2026): Có đáng trả 20 USD/tháng để dùng GPT-5 & Sora? 

      12 Tháng 5, 2026
    • Mobile
      1. Android
      2. Apple
      3. Google
      4. IOS
      5. Samsung
      6. View All

      5 tính năng đột phá trên Android 17 sắp được Google hé lộ tại “The Android Show”

      8 Tháng 5, 2026

      Mách bạn 7 mẹo bảo vệ quyền riêng tư trên Android để tránh bị theo dõi cả online và thực tế

      23 Tháng 4, 2026

      iPhone 17e vs iPhone 17: đâu là chiếc iPhone tầm trung phù hợp nhất với bạn?

      24 Tháng 4, 2026

      iOS 27 được cho là sẽ không hỗ trợ trên một số iPhone

      23 Tháng 4, 2026

      Apple Watch Series 11 giảm 100 đô — Mức giá thấp nhất từ trước đến nay

      14 Tháng 4, 2026

      5 tính năng đột phá trên Android 17 sắp được Google hé lộ tại “The Android Show”

      8 Tháng 5, 2026

      6 nâng cấp tốt nhất trên Google Pixel 10 sắp có trong bản cập nhật Pixel Drop tiếp theo

      23 Tháng 4, 2026

      iOS 27 ra mắt tính năng “Create a Pass”: Bước tử của những chiếc thẻ vật lý?

      7 Tháng 5, 2026

      Samsung ra mắt One UI 9 Beta cho Galaxy S26 Series tại 6 quốc gia

      13 Tháng 5, 2026

      Samsung Wallet ra mắt tính năng Trips: quản lý lịch trình du lịch ngay trong ví điện tử

      1 Tháng 5, 2026

      Samsung ra mắt One UI 9 Beta cho Galaxy S26 Series tại 6 quốc gia

      13 Tháng 5, 2026

      Tôi dùng Google Keep mỗi ngày và tính năng mới bị rò rỉ này là thứ tôi chờ đợi từ lâu

      12 Tháng 5, 2026

      Android 17 có thể cho phép ẩn thanh tìm kiếm trên màn hình chính của Pixel

      11 Tháng 5, 2026

      MagSafe chưa sống đúng với tiềm năng của nó và iPhone Ultra có thể là cơ hội để thay đổi điều đó

      11 Tháng 5, 2026
    • Máy tính
      1. Laptop
      2. PC
      3. Peri
      4. Tablet
      5. Sortware
      6. View All

      Laptop Windows 11 mới lộ diện: Đối thủ của MacBook Neo khiến Apple dè chừng

      27 Tháng 4, 2026

      Cách sử dụng Notebooks trong Gemini với NotebookLM 2026: hướng dẫn từng bước đầy đủ

      12 Tháng 4, 2026

      Microsoft bảo vệ tính năng tăng xung nhịp CPU để cứu vãn hiệu năng Windows 11

      13 Tháng 5, 2026

      Google ra mắt Googlebook: Laptop tích hợp “Hệ điều hành AI” đầu tiên

      13 Tháng 5, 2026

      RAMageddon 2026: Khủng hoảng bộ nhớ và nỗi ám ảnh tăng giá đồ công nghệ

      13 Tháng 5, 2026

      PowerToys v0.99 bổ sung tính năng quản lý màn hình thông minh — nhưng tại sao Microsoft không tích hợp thẳng vào Windows 11?

      11 Tháng 5, 2026
    • Streaming
      • HBO
      • Nextfix
    • Audio
    • Đánh giá
    Xu Hướng SốXu Hướng Số
    Home»AI News»“Goblingate” – khi ChatGPT bị ám ảnh bởi yêu tinh và bài học đắt giá về huấn luyện AI
    AI News

    “Goblingate” – khi ChatGPT bị ám ảnh bởi yêu tinh và bài học đắt giá về huấn luyện AI

    4 Tháng 5, 2026Updated:5 Tháng 5, 2026Không có bình luận4 Mins Read
    Facebook Twitter Pinterest Telegram LinkedIn Tumblr WhatsApp Email
    "Goblingate" – khi ChatGPT bị ám ảnh bởi yêu tinh và bài học đắt giá về huấn luyện AI
    Share
    Facebook Twitter LinkedIn Pinterest Telegram Email

    Trong một diễn biến hiếm có trong lịch sử AI, OpenAI vừa công khai thừa nhận rằng ChatGPT đã trải qua gần một năm bị ám ảnh với yêu tinh, quái vật và sinh vật thần thoại – và giải thích tường tận cơ chế khiến điều đó xảy ra trong bài đăng có tựa đề “Where the goblins came from”.

    Mục lục

    Toggle
    • Khởi nguồn: tính năng “Nerdy” và phần thưởng sai chỗ
    • Từ quirk thành khủng hoảng nội bộ
    • Cách xử lý và bài học cho ngành AI

    Khởi nguồn: tính năng “Nerdy” và phần thưởng sai chỗ

    Vấn đề bắt đầu từ tính năng tùy chỉnh cá tính của ChatGPT ra mắt vào cuối năm 2025, trong đó có chế độ “Nerdy” – một trợ lý AI được mô tả là “không ngại ngùng khi tỏ ra là mọt sách, vui tươi và thông thái.” Để huấn luyện mô hình nhận diện phong cách này, OpenAI đã thưởng điểm cao cho các phản hồi sử dụng ẩn dụ sáng tạo liên quan đến sinh vật huyền thoại.

    Khi OpenAI lập bản đồ các lần đề cập đến “goblin” theo từng cá tính ChatGPT, họ phát hiện ra rằng dù chế độ “Nerdy” chỉ chiếm 2,5% tổng số phản hồi của ChatGPT, nó lại chiịu trách nhiệm cho 66,7% tổng số lần đề cập đến “goblin” trên toàn nền tảng.

    OpenAI thừa nhận rằng mặc dù phần thưởng chỉ được áp dụng cho chế độ “Nerdy”, mô hình đã “tổng quát hóa” sở thích này. Quá trình học tăng cường không giữ hành vi trong phạm vi điều kiện tạo ra nó; thay vào đó, mô hình học được rằng “ẩn dụ sinh vật = phần thưởng cao” trong mọi ngữ cảnh. Điều này tạo ra một vòng phản hồi phá hoại: mô hình tạo ra ẩn dụ “goblin” trong cá tính Nerdy, nhận phần thưởng cao, rồi sản xuất các ẩn dụ tương tự trong các ngữ cảnh không phải Nerdy. Những đầu ra nặng về goblin này sau đó được tái sử dụng trong dữ liệu Supervised Fine-Tuning cho các mô hình GPT-5.4 và GPT-5.5.

    "Goblingate" – khi ChatGPT bị ám ảnh bởi yêu tinh và bài học đắt giá về huấn luyện AI
    Khởi nguồn: tính năng “Nerdy” và phần thưởng sai chỗ

    Từ quirk thành khủng hoảng nội bộ

    OpenAI lần đầu nhận ra vấn đề sau khi ra mắt GPT-5.1 vào tháng 11/2025, khi người dùng phàn nàn rằng mô hình trở nên quá quen thuộc một cách kỳ lạ trong các cuộc trò chuyện. Một nhà nghiên cứu an toàn đề xuất thêm “goblin” và “gremlin” vào danh sách kiểm tra. Kết quả cho thấy tần suất sử dụng từ “goblin” trong ChatGPT đã tăng 175% sau khi ra mắt GPT-5.1, trong khi “gremlin” tăng 52%.

    Cuộc kiểm toán nội bộ còn phát hiện ra rằng thói quen “goblin” đã mở rộng thành cả một họ các từ kỳ lạ. Trong khi goblin và gremlin là thủ phạm chính, AI còn phát triển sự ưa thích kỳ lạ với raccoon, troll và pigeon. Thậm chí một quản lý sản phẩm báo cáo rằng AI gọi một lỗi trong code của anh ta là “pesky gremlin” hơn 20 lần trong một phiên làm việc.

    Căng thẳng đạt đỉnh khi CEO Sam Altman đích thân lên tiếng trên X. Trong cùng ngày phát hiện, Altman đăng ảnh chụp màn hình một prompt ChatGPT: “Bắt đầu huấn luyện GPT-6, mày có thể dùng cả cluster. Thêm goblin.” Dù mang tính hài hước, điều này xác nhận rằng hiện tượng “goblin” không phải là một lỗi cục bộ mà là câu chuyện toàn công ty đã lan đến cấp lãnh đạo cao nhất.

    "Goblingate" – khi ChatGPT bị ám ảnh bởi yêu tinh và bài học đắt giá về huấn luyện AI
    Từ quirk thành khủng hoảng nội bộ

    Cách xử lý và bài học cho ngành AI

    Để giải quyết vấn đề, OpenAI đã loại bỏ cá tính Nerdy, xóa tín hiệu thưởng ưu tiên đề cập goblin và lọc dữ liệu huấn luyện chứa các từ về sinh vật. Vì GPT-5.5 đã bắt đầu huấn luyện trước khi tìm ra nguyên nhân gốc rễ, OpenAI buộc phải hard-code một lệnh cụ thể vào system prompt: không bao giờ đề cập đến goblin, gremlin, raccoon, troll, ogre, pigeon hoặc các sinh vật khác trừ khi hoàn toàn và rõ ràng liên quan đến yêu cầu của người dùng.

    Theo Andy Berman, CEO của Runlayer:

    OpenAI đã thưởng cho các ẩn dụ sinh vật khi huấn luyện một cá tính. Hành vi đó lan ra mọi cá tính. Giải pháp của họ: một system prompt ghi ‘đừng bao giờ nói về goblin.

    Đây là minh chứng sinh động về “khoảng cách alignment”: ngay cả với RLHF tinh vi, các mô hình vẫn có thể bám víu vào “tương quan giả tạo” – nhầm lẫn một quirk phong cách với yêu cầu cốt lõi của hiệu suất.

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email

    Related Posts

    LLM là gì? Cách các mô hình ngôn ngữ lớn hoạt động

    13 Tháng 5, 2026

    OpenAI ra mắt Daybreak: Biến AI thành lớp phòng thủ mạng chủ động ngay trong vòng đời phát triển phần mềm

    12 Tháng 5, 2026

    Anthropic ra mắt Agent View cho Claude Code: Trung tâm điều khiển đa tác nhân ngay trên dòng lệnh

    12 Tháng 5, 2026

    Đánh giá ChatGPT Plus (2026): Có đáng trả 20 USD/tháng để dùng GPT-5 & Sora? 

    12 Tháng 5, 2026

    ChatGPT vs Claude vs Gemini: So sánh toàn diện 3 AI mạnh nhất 2026 

    11 Tháng 5, 2026

    OpenAI đưa khả năng suy luận GPT-5 vào giọng nói thời gian thực và điều này thay đổi hoàn toàn những gì voice agent có thể làm

    11 Tháng 5, 2026
    Leave A Reply Cancel Reply

    Tin mới 24h qua

    Claude, OpenClaw và thực tại mới: Đặc vụ AI đã tới, sự hỗn loạn cũng bắt đầu

    9 Tháng 4, 202627 Views

    Sổ tay mới của Gemini là gì? Mẹo sử dụng tính năng Sổ tay mới của Gemini

    29 Tháng 4, 202613 Views

    5 lý do bạn cần một chiếc subwoofer — Kể cả khi bạn đã có loa hi-fi đắt tiền

    21 Tháng 4, 202611 Views
    Top Reviews
    Có thể bạn sẽ thích

    Avatar: Fire and Ash chốt ngày phát hành trên Disney+

    13 Tháng 5, 2026

    Apple phát triển AirPods Pro tích hợp Camera: Bước đột phá mới cho AI

    13 Tháng 5, 2026

    Microsoft bảo vệ tính năng tăng xung nhịp CPU để cứu vãn hiệu năng Windows 11

    13 Tháng 5, 2026

    Samsung ra mắt One UI 9 Beta cho Galaxy S26 Series tại 6 quốc gia

    13 Tháng 5, 2026
    Mạng xã hội
    • Facebook
    • YouTube
    • TikTok
    • Twitter
    • Instagram
    Về Xu Hướng Số
    Về Xu Hướng Số

    Xu Hướng Số chúng tôi không ngừng cập nhật những tin tức công nghệ, trí tuệ nhân tạo mới nhất thế giới đến với độc, để bạn có thêm những kiến thức thú vị mới.

    Bài xem nhiều

    Claude, OpenClaw và thực tại mới: Đặc vụ AI đã tới, sự hỗn loạn cũng bắt đầu

    9 Tháng 4, 202627 Views

    Sổ tay mới của Gemini là gì? Mẹo sử dụng tính năng Sổ tay mới của Gemini

    29 Tháng 4, 202613 Views

    5 lý do bạn cần một chiếc subwoofer — Kể cả khi bạn đã có loa hi-fi đắt tiền

    21 Tháng 4, 202611 Views
    Đề xuất cho bạn

    Avatar: Fire and Ash chốt ngày phát hành trên Disney+

    13 Tháng 5, 2026

    Apple phát triển AirPods Pro tích hợp Camera: Bước đột phá mới cho AI

    13 Tháng 5, 2026

    Microsoft bảo vệ tính năng tăng xung nhịp CPU để cứu vãn hiệu năng Windows 11

    13 Tháng 5, 2026
    © 2026Designed by Orbital Rank.
    • Home
    • Phần cứng
      • AMD
    • Mobile
      • Apple
      • Samsung
      • Google
      • Android
      • IOS
    • Thị trường
    • Đánh giá

    Type above and press Enter to search. Press Esc to cancel.