小白进修运用人工智能进行数据分析_数据_让我们
这不是很方便吗,特殊是如果您有一个充满客户数据的大型CSV文件?
让我们试一试,测试一下 ChatGPT 作为数据剖析助手的能力。
ChatGPT 可以读取什么样的数据?这是 ChatGPT 的回答:
ChatGPT 能够读取表格和数据库形式的构造化数据。
ChatGPT 的独特之处是它可以处理以自然措辞编写的各种格式的文本,例如新闻文章、社交媒体帖子、电子邮件、谈天等。但是,在本文中,我们将重点先容构造化数据。
ChatGPT 还声称它可以处理表格,电子表格和数据库形式的构造化数据。它还可以读取人类可读的格式,如HTML,XML,JSON和YAML。
因此,让我们让它读取CSV文件,看看它的表现如何。
关于测试数据集
在本实验中,我们将利用 Kaggle 中有关玄色星期五发卖的数据集。这个弘大的CSV文件包含有关零售店玄色星期五购买的550K记录,分为12列:
User_ID:标识每个买家
Product_ID:标识每个产品的唯一值
Gender:买家的性别(男或女)
Age:买家的年事
Occupation:买家的职业,以数值形式展现
City_Category:购买发生的城市种别
Stay_In_Current_City_Years:买家在其所在城市居住的年数
Marital_Status:买方的婚姻状况。0 表示单身,1 表示已婚。
Product_Category_1:产品的紧张种别,以数字形式指定。
Product_Category_2:产品的第一个子种别
Product_Category_3:产品的第二个子种别
Purchase:用户为一次购买花费的金额(以美元为单位)
考试测验利用 ChatGPT 读取 CSV 文件
1. 非常小的数据集让我们用一个 5 行的小数据集来测试。
成功!
正如它所说,ChatGPT确定这些数据是CSV格式的。它还精确标识每列的含义。
2. 让我们添加更多记录并过滤数据
现在让我们从这个数据库中取出50条记录,输入 ChatGPT,并哀求它过滤它们。
我已经粘贴了CSV文件中的前50个条款,并哀求ChatGPT在谈天窗口中显示它们。
果真,我得到了这个回应。事实证明,ChatGPT 能够从包含50条记录的 CSV 文件中过滤出数据。令人印象深刻!
它可以根据多个条件进行过滤吗?还是会被多个过滤器稠浊?让我们来试一试!
我哀求我们的AI朋友,以两个纯文本编写的标准为条件,过滤50行数据:请显示性别为M且年事为25-36的所有记录。
果真,ChatGPT过滤掉了精确的记录。但是,它不包括标题行。因此,如果要将此数据复制并粘贴到新的 CSV 文件中,则必须手动添加标题行。(不理想!
)
提高赌注,我们现在将给 ChatGPT 双倍的数据来处理。我复制并粘贴了前 100 个条款,并哀求它显示年事值为 55+ 的记录。
与我们之前的实验不同,这一次,ChatGPT 渲染了一个 Python 代码。我期待记录的内联显示,但这并不算完备缺点。但是,此输出见告我们 ChatGPT 的输出并不总是同等。
4. 添加更多数据,以及用ChatGPT做数据剖析时的技巧本文系作者个人观点,不代表本站立场,转载请注明出处!