TẤT CẢ AlphaMissense: AI phân loại đột biến gen người

AlphaMissense: AI phân loại đột biến gen người

🔬 Series Khoa học — Google DeepMind & AI Sinh học (Bài 3/7) — Bài trước: AlphaFold 3 — tương tác phân tử. Bài này chuyển từ cấu trúc sang chức năng: AlphaMissense giúp phân loại đột biến gen.

Mỗi người trong chúng ta có khoảng 5 triệu biến thể di truyền khác so với bộ gen tham chiếu. Phần lớn vô hại. Một số nhỏ gây bệnh. Nhưng làm sao biết được cái nào là cái nào?

Đây là bài toán mà AlphaMissense ra đời để giải quyết: phân loại các đột biến missense — một trong những loại biến thể di truyền phổ biến nhất — thành gây bệnh hoặc lành tính, nhanh hơn và chính xác hơn bất kỳ phương pháp nào trước đó.

Đột biến missense là gì?

DNA là bộ mã hướng dẫn tế bào tạo ra protein. DNA gồm 4 loại nucleotide (A, T, G, C) — giống một bảng chữ cái 4 ký tự. Cứ ba nucleotide liền nhau tạo thành một codon, mã hoá cho một axit amin.

Đột biến missense xảy ra khi một nucleotide bị thay thế bởi một nucleotide khác, dẫn đến thay đổi một axit amin trong protein.

Ví dụ kinh điển: bệnh thiếu máu hồng cầu liềm (sickle cell anemia) chỉ do một nucleotide thay đổi: GAG → GTG, biến axit amin glutamic acid thành valine ở vị trí số 6 của chuỗi beta-hemoglobin. Một thay đổi nhỏ đủ để làm biến dạng toàn bộ tế bào hồng cầu.

Nhưng không phải missense nào cũng nguy hiểm. Nhiều thay đổi không ảnh hưởng đến chức năng protein — vì axit amin mới có tính chất tương tự, hoặc nằm ở vùng không quan trọng. Vấn đề là: có hàng triệu missense khả dĩ trong bộ gen người, nhưng chỉ một phần rất nhỏ đã được nghiên cứu thực nghiệm.

Bài toán nan giải

Khi một bệnh nhân làm xét nghiệm gen và phát hiện một đột biến missense mới — chưa ai gặp trước đây — bác sĩ đối mặt với câu hỏi: đột biến này có gây bệnh không?

Phương pháp truyền thống:

  1. Nghiên cứu gia đình — xem đột biến có di truyền cùng bệnh không? Mất nhiều năm.
  2. Thí nghiệm chức năng — biểu hiện protein đột biến trong phòng lab. Mất nhiều tháng.
  3. Phương pháp tính toán cũ — dùng các công cụ như SIFT, PolyPhen. Độ chính xác hạn chế, tỷ lệ dương tính giả cao.

Kết quả: hàng ngàn biến thể được ghi nhận là "VUS" (Variants of Uncertain Significance — biến thể chưa rõ ý nghĩa) trong cơ sở dữ liệu ClinVar. Bệnh nhân nhận kết quả xét nghiệm với một dấu hỏi lớn.

AlphaMissense giải quyết thế nào

Công bố tháng 9 năm 2023 trên tạp chí Science, AlphaMissense sử dụng kiến trúc tương tự AlphaFold nhưng tinh chỉnh cho bài toán khác. Thay vì dự đoán cấu trúc 3D, nó dự đoán xác suất gây bệnh dựa trên:

  1. Bối cảnh tiến hoá — axit amin này có được bảo tồn qua các loài không? Nếu một vị trí luôn giống nhau từ vi khuẩn đến người, thay đổi ở đó rất nguy hiểm.
  2. Cấu trúc protein — vị trí đột biến nằm ở trung tâm hoạt động, bề mặt hay vùng liên kết?
  3. Tương tác giữa các axit amin — thay đổi có phá vỡ cấu trúc không gian không?

AlphaMissense đánh giá 71 triệu missense khả dĩ — bao phủ hầu hết các biến thể mà một người có thể mang. Kết quả:

LoạiSố lượng
Tổng số missense khả dĩ71 triệu
Được phân loại gây bệnh32% (23 triệu)
Được phân loại lành tính57% (40 triệu)
Không rõ (độ tin cậy thấp)11% (8 triệu)

So với ClinVar (cơ sở dữ liệu tích luỹ hàng chục năm), AlphaMissense khớp với kết quả thực nghiệm 90% — cao hơn đáng kể so với các phương pháp trước đó.

Ứng dụng thực tế

AlphaMissense đã được tích hợp vào nhiều quy trình lâm sàng:

  • Xét nghiệm di truyền — giúp giải thích các biến thể VUS, giảm số lượng kết quả không rõ ràng
  • Sàng lọc bệnh di truyền — đánh giá nguy cơ của hàng trăm gen liên quan bệnh lý
  • Nghiên cứu ung thư — nhiều đột biến missense gây ung thư (ví dụ trong gen TP53, BRCA1/2)
  • Phát triển thuốc — hiểu đột biến nào làm protein kháng thuốc để thiết kế liệu pháp thay thế

Một ví dụ: với gen TP53 — gen ức chế khối u quan trọng nhất — AlphaMissense phân loại gần như tất cả missense trong vùng liên kết DNA là gây bệnh (phù hợp thực nghiệm), đồng thời phát hiện một số vùng ngoại biên ít nguy hiểm hơn mà trước đây chưa có dữ liệu.

AlphaMissense có thể thay thế xét nghiệm di truyền không?

Không. AlphaMissense là công cụ hỗ trợ phân tích, không thay thế chẩn đoán lâm sàng. Kết quả cần được bác sĩ di truyền xem xét kết hợp với tiền sử gia đình và các xét nghiệm khác.

AlphaMissense có dùng được cho tất cả các gen không?

Có, mô hình bao phủ tất cả protein người. Nhưng độ chính xác cao nhất ở các gen có nhiều dữ liệu tiến hoá; với gen ít được bảo tồn (ít loài tương đồng), độ tin cậy thấp hơn.

Tóm lại

AlphaMissense là chiếc la bàn cho một trong những vấn đề lớn nhất của y học di truyền: xác định missense nào thực sự nguy hiểm. Kết hợp sức mạnh dự đoán cấu trúc từ AlphaFold với phân tích tiến hoá và chức năng, mô hình mang lại câu trả lời cho 71 triệu câu hỏi — gần 90% trong số đó khớp với thực nghiệm.

Từ cấu trúc (AlphaFold) đến chức năng (AlphaMissense), DeepMind đang xây dựng nền tảng cho một thế hệ y học mới. Bài tiếp theo: AlphaProteo — thiết kế protein mới bằng AI. Từ phân tích đến sáng tạo. +++

FAQ: Câu hỏi thường gặp

AlphaMissense là gì?
AlphaMissense là mô hình AI của DeepMind phân loại các đột biến missense — đột biến thay đổi một axit amin trong protein — thành có khả năng gây bệnh hoặc lành tính.
AlphaMissense khác AlphaFold thế nào?
AlphaFold dự đoán cấu trúc protein, còn AlphaMissense đánh giá tác động của đột biến lên chức năng protein — từ cấu trúc sang chức năng.
Đột biến missense là gì?
Đột biến missense là thay đổi một nucleotide trong DNA, dẫn đến thay đổi một axit amin trong protein. Một số gây bệnh (ví dụ thiếu máu hồng cầu liềm), số khác vô hại.
AlphaMissense có ứng dụng gì trong y học?
Giúp bác sĩ và nhà di truyền học xác định đột biến nào thực sự nguy hiểm trong kết quả xét nghiệm gen, hỗ trợ chẩn đoán bệnh di truyền và y học cá nhân hoá.

Bình luận

Đang tải bình luận…

    Đăng nhập để tham gia thảo luận.

    Đăng nhập bằng Google để bình luận

    Chỉ dùng để bình luận. Không truy cập trình soạn thảo/CMS.

    📐 Font Stack

    Headings IBM Plex Sans

    Đẳng cấp & Cá tính — cho mọi tiêu đề

    Weight 700 Letter-spacing -0.015em
    Body Text Inter

    X-height cao, trung tính — tối ưu đọc văn bản dài. Hỗ trợ đầy đủ glyph tiếng Việt.

    Weight 400 Line-height 1.7
    Code JetBrains Mono

    const fn = (x: number) => x * 2;

    Weight 500 Ligatures