作为一名从事软件开发,主要专注于构建网络产品的开发人员,我一直对新兴技术感到好奇。在 ChatGPT 发布后,人们对人工智能的兴趣激增,这激发了我深入研究这个迷人领域的愿望。以下是我的旅程是如何展开的。
我从一个 YouTube 视频(Wolfram 的解释)开始,该视频分解了 ChatGPT 如何预测句子中的下一个单词(如果您不想观看视频,可以阅读文章中的文字记录)。这个介绍让我大开眼界——它揭示了人工智能,特别是大型语言模型(LLM)已经变得多么先进。它还向我介绍了 LLM 领域的基础概念,为我更深入的探索奠定了基础。
从那里开始,我开始学习不同的 LLM,例如 Llama、GPT、Claude 等。这个阶段主要是了解技术方面,如上下文长度、tokens(输入和输出)、参数、embeddings、FLOPS(每秒浮点运算次数)、RAG(检索增强生成)。为了使事情更具实践性,我尝试使用 Ollama 等工具在本地运行 LLM。这是我第一次亲身体验本地模型,我对它们的潜力感到惊讶。
此阶段的一些资源:
接下来,仅仅理解这些技术术语是不够的,我们必须探索并亲身实践,才能真正理解这些术语是如何相互关联的,以及它们在什么地方发挥作用,以及为什么需要它们。我使用 Jupyter Notebook 探索了它们,这是一个允许我为各种任务运行 Python 指令的工具。这使我接触到了 LangChain 和 Kaggle 等平台,我在这些平台上尝试了基本的 LLM 训练和模型微调。这些经验帮助我了解了人工智能模型是如何训练和微调的,让我对它们的功能有了更全面的了解。
此阶段的一些资源:
有了这些不断增长的知识,我开始使用 Cursor 和 Windsurf 等工具构建人工智能驱动的应用程序(数独,页面保存器),这些工具由人工智能驱动的编辑器增强。我很快意识到人工智能对开发人员的变革性影响。我在软件开发中面临的许多挑战都可以通过人工智能简化甚至完全解决。这是一个关键时刻,突显了人工智能在重塑我们工作方式方面的巨大潜力。
虽然我的旅程仍在继续,但有一点是明确的——人工智能不仅仅是一种趋势:它是未来。我所采取的每一步都加深了我对该领域及其可能性的认识。我很高兴看到这段旅程接下来会把我带到哪里,以及人工智能将如何继续彻底改变我们的生活,无论是作为开发人员还是作为个人。