AlphaMissense: AI phân loại đột biến gen người
🔬 Series Khoa học — Google DeepMind & AI Sinh học (Bài 3/7) — Bài trước: AlphaFold 3 — tương tác phân tử. Bài này chuyển từ cấu trúc sang chức năng: AlphaMissense giúp phân loại đột biến gen.
Mỗi người trong chúng ta có khoảng 5 triệu biến thể di truyền khác so với bộ gen tham chiếu. Phần lớn vô hại. Một số nhỏ gây bệnh. Nhưng làm sao biết được cái nào là cái nào?
Đây là bài toán mà AlphaMissense ra đời để giải quyết: phân loại các đột biến missense — một trong những loại biến thể di truyền phổ biến nhất — thành gây bệnh hoặc lành tính, nhanh hơn và chính xác hơn bất kỳ phương pháp nào trước đó.
Đột biến missense là gì?
DNA là bộ mã hướng dẫn tế bào tạo ra protein. DNA gồm 4 loại nucleotide (A, T, G, C) — giống một bảng chữ cái 4 ký tự. Cứ ba nucleotide liền nhau tạo thành một codon, mã hoá cho một axit amin.
Đột biến missense xảy ra khi một nucleotide bị thay thế bởi một nucleotide khác, dẫn đến thay đổi một axit amin trong protein.
Ví dụ kinh điển: bệnh thiếu máu hồng cầu liềm (sickle cell anemia) chỉ do một nucleotide thay đổi: GAG → GTG, biến axit amin glutamic acid thành valine ở vị trí số 6 của chuỗi beta-hemoglobin. Một thay đổi nhỏ đủ để làm biến dạng toàn bộ tế bào hồng cầu.
Nhưng không phải missense nào cũng nguy hiểm. Nhiều thay đổi không ảnh hưởng đến chức năng protein — vì axit amin mới có tính chất tương tự, hoặc nằm ở vùng không quan trọng. Vấn đề là: có hàng triệu missense khả dĩ trong bộ gen người, nhưng chỉ một phần rất nhỏ đã được nghiên cứu thực nghiệm.
Bài toán nan giải
Khi một bệnh nhân làm xét nghiệm gen và phát hiện một đột biến missense mới — chưa ai gặp trước đây — bác sĩ đối mặt với câu hỏi: đột biến này có gây bệnh không?
Phương pháp truyền thống:
- Nghiên cứu gia đình — xem đột biến có di truyền cùng bệnh không? Mất nhiều năm.
- Thí nghiệm chức năng — biểu hiện protein đột biến trong phòng lab. Mất nhiều tháng.
- Phương pháp tính toán cũ — dùng các công cụ như SIFT, PolyPhen. Độ chính xác hạn chế, tỷ lệ dương tính giả cao.
Kết quả: hàng ngàn biến thể được ghi nhận là "VUS" (Variants of Uncertain Significance — biến thể chưa rõ ý nghĩa) trong cơ sở dữ liệu ClinVar. Bệnh nhân nhận kết quả xét nghiệm với một dấu hỏi lớn.
AlphaMissense giải quyết thế nào
Công bố tháng 9 năm 2023 trên tạp chí Science, AlphaMissense sử dụng kiến trúc tương tự AlphaFold nhưng tinh chỉnh cho bài toán khác. Thay vì dự đoán cấu trúc 3D, nó dự đoán xác suất gây bệnh dựa trên:
- Bối cảnh tiến hoá — axit amin này có được bảo tồn qua các loài không? Nếu một vị trí luôn giống nhau từ vi khuẩn đến người, thay đổi ở đó rất nguy hiểm.
- Cấu trúc protein — vị trí đột biến nằm ở trung tâm hoạt động, bề mặt hay vùng liên kết?
- Tương tác giữa các axit amin — thay đổi có phá vỡ cấu trúc không gian không?
AlphaMissense đánh giá 71 triệu missense khả dĩ — bao phủ hầu hết các biến thể mà một người có thể mang. Kết quả:
| Loại | Số lượng |
|---|---|
| Tổng số missense khả dĩ | 71 triệu |
| Được phân loại gây bệnh | 32% (23 triệu) |
| Được phân loại lành tính | 57% (40 triệu) |
| Không rõ (độ tin cậy thấp) | 11% (8 triệu) |
So với ClinVar (cơ sở dữ liệu tích luỹ hàng chục năm), AlphaMissense khớp với kết quả thực nghiệm 90% — cao hơn đáng kể so với các phương pháp trước đó.
Ứng dụng thực tế
AlphaMissense đã được tích hợp vào nhiều quy trình lâm sàng:
- Xét nghiệm di truyền — giúp giải thích các biến thể VUS, giảm số lượng kết quả không rõ ràng
- Sàng lọc bệnh di truyền — đánh giá nguy cơ của hàng trăm gen liên quan bệnh lý
- Nghiên cứu ung thư — nhiều đột biến missense gây ung thư (ví dụ trong gen TP53, BRCA1/2)
- Phát triển thuốc — hiểu đột biến nào làm protein kháng thuốc để thiết kế liệu pháp thay thế
Một ví dụ: với gen TP53 — gen ức chế khối u quan trọng nhất — AlphaMissense phân loại gần như tất cả missense trong vùng liên kết DNA là gây bệnh (phù hợp thực nghiệm), đồng thời phát hiện một số vùng ngoại biên ít nguy hiểm hơn mà trước đây chưa có dữ liệu.
AlphaMissense có thể thay thế xét nghiệm di truyền không?
Không. AlphaMissense là công cụ hỗ trợ phân tích, không thay thế chẩn đoán lâm sàng. Kết quả cần được bác sĩ di truyền xem xét kết hợp với tiền sử gia đình và các xét nghiệm khác.
AlphaMissense có dùng được cho tất cả các gen không?
Có, mô hình bao phủ tất cả protein người. Nhưng độ chính xác cao nhất ở các gen có nhiều dữ liệu tiến hoá; với gen ít được bảo tồn (ít loài tương đồng), độ tin cậy thấp hơn.
Tóm lại
AlphaMissense là chiếc la bàn cho một trong những vấn đề lớn nhất của y học di truyền: xác định missense nào thực sự nguy hiểm. Kết hợp sức mạnh dự đoán cấu trúc từ AlphaFold với phân tích tiến hoá và chức năng, mô hình mang lại câu trả lời cho 71 triệu câu hỏi — gần 90% trong số đó khớp với thực nghiệm.
Từ cấu trúc (AlphaFold) đến chức năng (AlphaMissense), DeepMind đang xây dựng nền tảng cho một thế hệ y học mới. Bài tiếp theo: AlphaProteo — thiết kế protein mới bằng AI. Từ phân tích đến sáng tạo. +++
Bình luận
Đang tải bình luận…
Chưa có bình luận nào. Hãy là người đầu tiên chia sẻ ý kiến.
Đăng nhập để tham gia thảo luận.
Đăng nhập bằng Google để bình luậnChỉ dùng để bình luận. Không truy cập trình soạn thảo/CMS.
Không kết nối được máy chủ. Vui lòng thử lại.