date
password
icon
hashtag
标题
勘误
type
status
slug
summary
tags
category
URL
AI summary
AI custom autofill
贴文
类型
Status
标签
🪄
Text
Multi-select
探索数据科学家的 AI 助理 — 释放 ChatGPT 和 Google BARD 的力量
介绍
在当今数据驱动的世界中,数据科学领域在提取有价值的见解和做出明智的决策方面发挥着至关重要的作用。然而,数据科学项目通常涉及复杂的任务,从数据预处理和探索性分析到模型训练和结果解释。
现在,想象一下有一个智能助手可以理解您的数据相关查询、指导您完成分析过程并提供实时见解。这就是AI Bot介入的地方,为数据科学项目提供创新和交互式的方法。
在本文中,我们将更多地讨论AI Bot的世界,并探讨它们在数据科学项目中的作用,特别是机器学习建模。我们将研究当今最流行的两种AI Bot工具,它们是:
- OpenAI ChatGPT
- Google BARD
这些AI Bot经过大量文本数据的训练,能够理解自然语言,甚至完成要求它们完成的复杂任务。
在本文中,我们将探讨如何为这两个AI Bot制作提示以获得高质量的响应。但这里有一个问题,为了让事情变得有趣,我们将让这两个AI Bot相互竞争,看看哪一个最终能想出更好的模型!这次,我们将使用一个干净简单的股票市场数据集。这是数据的片段。
ChatGPT
首先是 ChatGPT!这个AI工具无需介绍,但对于那些生活在岩石下的人来说,ChatGPT是OpenAI最受欢迎的作品。它于 2022 年底推出后仅 5 天就达到了 100 万用户。相比之下,Instagram 用了 2.5 个月才达到 100 万用户,Twitter 用了 2 年,Netflix 用了 3.5 年。该AI Bot利用 OpenAI 的大型语言模型,并接受了来自互联网的大量文本的训练(与大多数其他AI Bot一样)。因此,ChatGPT 能够执行语言翻译、文本生成、文本完成等任务,甚至帮助生成代码或排除代码故障。我们现在将了解如何为 ChatGPT 创建提示以及创建模型时的效果如何。
项目计划
当开始一个新项目时,我们几乎总是会获得一个数据集,根据它的大小,我们可能不确定应该采取哪些步骤来实现项目的最终目标。在这里,我们可以查阅 ChatGPT,它可以帮助我们生成要遵循的步骤列表。
这是我创建的提示和 ChatGPT 的响应。
ChatGPT 为我们列出了创建模型时需要遵循的 9 个步骤,该模型可以帮助我们根据数据集中给出的输入特征来预测房价。它还为我们提供了每个步骤的简要描述。为了简单起见,我们只需要求模型分割数据集并为我们创建模型。
分割数据集
在此示例中,让 ChatGPT 使用 python 将数据拆分为训练集和测试集。
在这里,ChatGPT 为我们提供了导入的库来完成此任务。它正确地为我们识别了输入特征和目标变量。它还为我们建议了 80:20 的分流比,但您也可以告诉它使用其他比例进行分流。
创建模型
最后,让我们尝试要求 ChatGPT 根据它帮助我们创建的训练集和测试集创建一个逻辑回归模型。
就这样,我们在 ChatGPT 的帮助下,使用 scikit-learn 库在几分钟内创建了一个逻辑回归模型!
但这个模型的表现如何呢?我运行了 ChatGPT 给我的代码,它的准确度为 1.0!尽管这可能是模型的理想分数,但满分可能会让人怀疑该模型是否可能过度拟合。
Google Bard
第二位参赛者是Google Bard!Google Bard 是 Google 于 2023 年 3 月发布的全新 AI 聊天机器人,与 ChatGPT 一样,它也是基于大型语言模型(PaLM2)构建的,可以执行与 ChatGPT 类似的任务。然而,Bard 与 ChatGPT 的一大区别是 Google Bard 可以访问互联网,而 ChatGPT 不具备这一属性。这使得 Bard 能够提供最新信息,这与 ChatGPT 不同,ChatGPT 仅接受 2021 年 9 月之前的信息培训。
现在让我们看看如何利用 Google Bard 来执行我们刚刚完成的相同项目!当谈到Bard时,我们必须更加具体地提供我们的意见,才能收到Bard的高质量回复。
让我们首先要求Bard制定创建预测房价模型所需采取的步骤。
提示:“充当数据科学家。您的任务是制定步骤来创建一个机器学习模型,该模型可以在给定一些输入特征的情况下预测股市方向(向上或向下)。您已获得一个由 1250 行和 10 列组成的股票市场数据集 ['ID', Year, Lag1, Lag2, Lag3, Lag4, Lag5, Volume, Today, Direction]。”
响应与 ChatGPT 非常相似。但是,请注意提示中的差异。我们必须请Bard作为数据科学家来规划该项目。为了从 Bard 获得良好且更可靠的响应,这一点至关重要。现在让我们要求它为我们分割数据集!
提示:“现在使用 scikit-learn 在 python 中编写代码,将上面的数据集拆分为训练集和测试集。”
当谈到分割训练集和测试集时,我们必须明确要求 Bard 使用 scikit-learn 库。否则的话,Bard也不会使用它,而会使用其他的方法来完成这个任务。但是,由于我们计划实现机器学习模型,因此我们更愿意使用 scikit-learn 库。Bard 还将数据集分割成 75:25 的比例,而不是 80:20 的比例。最后,我们将要求Bard创建逻辑回归模型
提示:“现在您的任务是编写 Python 代码来构建预测股市方向的逻辑回归模型。”
Google Bard 再次帮助我们创建了一个 Logistic 回归模型,以根据提供给我们的数据集来预测股市走向!
在我的 Jupyter Notebook 中运行此代码后,模型的准确度得分为 0.9936!这也非常高,可能表明过度拟合。
结论
在人工智能驱动工具不断发展的格局中,ChatGPT 和 Google Bard 都展示了其创建模型的独特能力。通过比较分析,我们探讨了它们的优势、差异,以及它们如何完成构建逻辑回归模型来预测股市方向的任务。然而,这是一个非常简单的例子,因此结果可能不可靠,所以要持保留态度!
ChatGPT 表明它能够指导我们完成数据探索过程,并在此过程中提供有价值的见解。此外,它的对话性质允许协作体验,使我们能够无缝地互动和迭代想法。
另一方面,Google Bard 需要更加结构化和高效的通信。清晰简洁的说明使我们能够简化模型构建过程,使其成为需要精确和快速执行的项目的理想选择。
我们很幸运能够使用如此强大的AI Bot工具(免费!),每个工具都有其独特的特点,可以满足不同的项目需求。因此,当您踏上数据科学之旅时,这些AI Bot之间的选择最终取决于您首选的交互风格、项目复杂性和个人偏好。
总之,利用 ChatGPT 和 Google Bard 等 AI 聊天机器人可以显着提高数据科学项目的生产力和有效性。这些对话式人工智能助手可以成为您的伴侣,指导您完成数据探索、模型训练和决策,最终使您能够从数据中发现有价值的见解。
当我们继续拥抱人工智能的可能性时,必须记住这些工具是为了增强我们的技能,而不是取代它们。通过将人工智能的力量与人类专业知识相结合,我们可以充满信心和创造力地驾驭数据科学领域。
作者:Arthur Chong
- 作者:Inevitable AI
- 链接:https://www.Inevitableai.ltd/article/share105
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。