AlphaProteo: AI thiết kế protein mới
🔬 Series Khoa học — Google DeepMind & AI Sinh học (Bài 4/7) — Bài trước: AlphaMissense — phân loại đột biến gen. Bài này chuyển từ phân tích sang sáng tạo: AlphaProteo thiết kế protein hoàn toàn mới.
AlphaFold hiểu cấu trúc protein. AlphaMissense đánh giá đột biến. Nhưng bước tiếp theo — có lẽ là thú vị nhất — là thiết kế protein mới: tạo ra những protein chưa từng tồn tại trong tự nhiên, có chức năng mong muốn.
AlphaProteo, công bố tháng 9 năm 2024, là bước tiến của DeepMind trong lĩnh vực protein design — nơi AI không còn là công cụ phân tích mà trở thành nhà thiết kế sinh học.
Từ dự đoán đến thiết kế
Giữa dự đoán cấu trúc protein và thiết kế protein mới có một khoảng cách lớn. Giống như khác nhau giữa:
- Đọc hiểu một công trình kiến trúc (cấu trúc, vật liệu, chức năng) — AlphaFold
- Thiết kế một toà nhà mới chưa ai xây — AlphaProteo
Thiết kế protein là bài toán: cho trước một mục tiêu phân tử (ví dụ: độc tố vi khuẩn, tế bào ung thư, enzyme), hãy tạo ra một protein mới có khả năng gắn vào mục tiêu đó với độ chính xác cao.
Vì sao khó? Không gian các protein khả dĩ là 10^(1300) — lớn hơn nhiều số nguyên tử trong vũ trụ (10^80). Chỉ một phần không tưởng tượng nổi trong số đó có chức năng hữu ích và cuộn gấp ổn định. Tìm ra một protein phù hợp là tìm kim trong bãi biển — nhưng bãi biển này rộng bằng vũ trụ.
AlphaProteo hoạt động thế nào
AlphaProteo kết hợp các kỹ thuật từ AlphaFold với một lớp "thiết kế ngược" (inverse folding):
- Mục tiêu là gì? — Xác định vị trí trên bề mặt protein mục tiêu mà protein mới sẽ gắn vào
- Sinh scaffold — Tạo ra khung protein (scaffold) có hình dạng phù hợp để gắn vào vị trí đó
- Tối ưu hoá — Tinh chỉnh trình tự axit amin để tối đa hoá ái lực gắn kết
- Kiểm tra cấu trúc — Dùng mô hình (giống AlphaFold) để kiểm tra protein mới có cuộn gấp ổn định không
- Lọc — Chọn các ứng viên tốt nhất để tổng hợp và thử nghiệm
Kết quả thực nghiệm: AlphaProteo thiết kế protein gắn vào 7 mục tiêu khác nhau (gồm protein virus, độc tố vi khuẩn, protein tín hiệu). So với các phương pháp thiết kế truyền thống, tỷ lệ thành công cao hơn 10–100 lần và thời gian thiết kế nhanh hơn đáng kể.
| Protein mục tiêu | Phương pháp cũ | AlphaProteo | Cải thiện |
|---|---|---|---|
| VEGF (tín hiệu mạch máu) | 3% gắn thành công | 38% | ~12x |
| PD-L1 (ức chế miễn dịch) | 4% | 29% | ~7x |
| RSV (virus hợp bào hô hấp) | 2% | 19% | ~9x |
| Độc tố Clostridium | 1% | 14% | ~14x |
Ứng dụng: từ kháng thể đến enzyme công nghiệp
Y học — kháng thể trị liệu Kháng thể là protein do hệ miễn dịch tạo ra để gắn vào mục tiêu lạ. AlphaProteo có thể thiết kế protein gắn vào:
- Tế bào ung thư — đưa thuốc hoặc tín hiệu miễn dịch đến đúng chỗ
- Virus — ngăn chặn gắn kết vào tế bào chủ
- Protein gây viêm — điều chỉnh phản ứng miễn dịch quá mức
Công nghiệp — enzyme thiết kế Enzyme là protein xúc tác phản ứng hoá học. AlphaProteo có thể thiết kế:
- Enzyme phân huỷ nhựa PET
- Enzyme tổng hợp nhiên liệu sinh học
- Enzyme xử lý chất thải công nghiệp
Nông nghiệp
- Protein bảo vệ cây trồng không cần thuốc trừ sâu hoá học
- Protein tăng cường hấp thụ dinh dưỡng
Hạn chế và thách thức
Dù ấn tượng, AlphaProteo vẫn có hạn chế:
- Độ ổn định — protein thiết kế hoạt động trong ống nghiệm (in vitro) nhưng chưa chắc ổn định trong cơ thể (in vivo)
- Tính sinh miễn dịch — protein mới có thể bị hệ miễn dịch tấn công
- Chức năng phức tạp — thiết kế protein có nhiều chức năng (vừa gắn, vừa xúc tác, vừa điều khiển) là bài toán mở
- Kiểm soát đạo đức — khả năng thiết kế protein mới đặt ra câu hỏi về an toàn sinh học và sử dụng kép (dual-use)
AlphaProteo có thể thiết kế protein cho bất kỳ mục tiêu nào không?
Về lý thuyết có, nhưng độ khó khác nhau. Mục tiêu có bề mặt phẳng hoặc lõm sâu dễ hơn mục tiêu lồi. Một số mục tiêu (ví dụ protein màng, protein vô cấu trúc) vẫn là thách thức.
Protein thiết kế xong có cần thử nghiệm thật không?
Có. Dù AlphaProteo cải thiện tỷ lệ thành công đáng kể, vẫn cần tổng hợp và thử nghiệm thực tế — không mô hình nào thay thế hoàn toàn thực nghiệm được.
Tóm lại
AlphaProteo là bước chuyển quan trọng từ "AI phân tích sinh học" sang "AI thiết kế sinh học". Nếu AlphaFold cho phép ta đọc ngôn ngữ protein, AlphaProteo cho phép ta viết ngôn ngữ đó — tạo ra những protein chưa từng tồn tại để giải quyết vấn đề của con người.
Bài tiếp theo: AlphaGenome — Phần 1: Vùng điều hoà DNA. DeepMind mở rộng từ protein lên toàn bộ bộ gen. +++
Bình luận
Đang tải bình luận…
Chưa có bình luận nào. Hãy là người đầu tiên chia sẻ ý kiến.
Đăng nhập để tham gia thảo luận.
Đăng nhập bằng Google để bình luậnChỉ dùng để bình luận. Không truy cập trình soạn thảo/CMS.
Không kết nối được máy chủ. Vui lòng thử lại.