Là một người làm trong lĩnh vực phát triển phần mềm, chủ yếu tập trung vào việc xây dựng các sản phẩm web, tôi luôn tò mò về các công nghệ mới nổi. Sự bùng nổ quan tâm đến AI, đặc biệt là sau khi ChatGPT ra mắt, đã khơi dậy mong muốn tìm hiểu sâu hơn về lĩnh vực hấp dẫn này. Đây là cách hành trình của tôi diễn ra.
Tôi bắt đầu với một video trên YouTube (giải thích của Wolfram) phân tích cách ChatGPT dự đoán từ tiếp theo trong một câu (nếu bạn không muốn xem video, bạn có thể đọc bản ghi trong bài viết). Phần giới thiệu này đã mở mang tầm mắt—nó cho thấy AI, đặc biệt là các mô hình ngôn ngữ lớn (LLM), đã trở nên tiên tiến như thế nào. Nó cũng giới thiệu cho tôi các khái niệm cơ bản trong lĩnh vực LLM, đặt nền móng cho việc khám phá sâu hơn của tôi.
Từ đó, tôi bắt đầu tìm hiểu về các LLM khác nhau như Llama, GPT, Claude và các LLM khác. Giai đoạn này là tất cả về việc hiểu các khía cạnh kỹ thuật như độ dài ngữ cảnh, token (đầu vào và đầu ra), tham số, embedding, FLOPS (Số phép toán dấu phẩy động trên giây), RAG (Tạo sinh tăng cường truy xuất). Để mọi thứ trở nên thiết thực hơn, tôi đã thử nghiệm chạy LLM cục bộ bằng các công cụ như Ollama. Đó là trải nghiệm thực hành đầu tiên của tôi với các mô hình cục bộ và tôi đã rất ngạc nhiên về tiềm năng của chúng.
Một số tài nguyên trong giai đoạn này:
- Tất cả những gì bạn cần biết về Tokenization trong LLM
- Hướng dẫn nhanh Llama Recipes
- Mọi thứ tôi đã học được cho đến nay về việc chạy LLM cục bộ
Tiếp theo, việc hiểu các thuật ngữ công nghệ đó là không đủ, chúng ta phải khám phá và thực hành để thực sự hiểu cách các thuật ngữ này liên kết với nhau và chúng đóng vai trò ở đâu và tại sao chúng lại cần thiết. Tôi đã khám phá chúng bằng Jupyter Notebook—một công cụ cho phép tôi chạy các hướng dẫn Python cho nhiều tác vụ khác nhau. Điều này đã dẫn tôi đến các nền tảng như LangChain và Kaggle, nơi tôi đã thử nghiệm với việc đào tạo LLM cơ bản và tinh chỉnh mô hình. Những trải nghiệm này đã giúp tôi hiểu cách các mô hình AI được đào tạo và tinh chỉnh, mang lại cho tôi một cái nhìn toàn diện hơn về khả năng của chúng.
Một số tài nguyên trong giai đoạn này:
Được trang bị kiến thức ngày càng tăng này, tôi bắt đầu xây dựng các ứng dụng hỗ trợ AI (Sudoku, Page Saver) bằng các công cụ như Cursor và Windsurf, được tăng cường bởi các trình chỉnh sửa do AI điều khiển. Tôi nhanh chóng nhận ra AI có thể mang lại sự thay đổi lớn như thế nào cho các nhà phát triển. Nhiều thách thức tôi gặp phải trong quá trình phát triển phần mềm có thể được sắp xếp hợp lý hoặc thậm chí được giải quyết hoàn toàn bằng AI. Đây là một khoảnh khắc quan trọng nhấn mạnh tiềm năng to lớn của AI trong việc định hình lại cách chúng ta làm việc.
Mặc dù hành trình của tôi vẫn đang tiếp diễn, nhưng có một điều rõ ràng—AI không chỉ là một xu hướng: đó là tương lai. Mỗi bước tôi đã thực hiện đều làm sâu sắc thêm sự đánh giá của tôi về lĩnh vực này và những khả năng của nó. Tôi rất hào hứng được xem hành trình này sẽ đưa tôi đến đâu tiếp theo và AI sẽ tiếp tục cách mạng hóa cuộc sống của chúng ta như thế nào, cả với tư cách là nhà phát triển và với tư cách là cá nhân.