Update 4.8数据分析.md

This commit is contained in:
zzm
2023-04-27 11:37:54 +08:00
committed by GitHub
parent f5cc37e98d
commit 234bc76954

View File

@@ -17,14 +17,16 @@
数据科学是当今计算机和互联网领域最热门的话题之一。直到今天,人们已经从应用程序和系统中收集了相当大量的数据,现在是分析它们的时候了。从数据中产生建议并创建对未来的预测。[在这个网站中](https://www.quora.com/Data-Science/What-is-data-science),您可以找到对于数据科学的更为精确的定义。
同时,我向各位推荐一个非常有趣的科普视频想你讲解数据分析师到底在做什么:[怎么会有这么性感的职业吶?](https://www.bilibili.com/video/BV1ZW4y1x7UU/?spm_id_from=333.999.0.0&vd_source=2cb6252f9211ae9d29cf1f76f0aea8d7)
# Datawhale的生态体系
在与Datawhale开源委员会的负责人文睿进行一翻畅谈之后。zzm受震惊于其理念以及已经构建的较为完善的体系架构毅然决然的删除了本章和其广泛的体系比起来相形见绌的内容。为了更大伙更好的阅读以及学习体验我们决定在本章内容引入[datawhale人工智能培养方案数据分析体系](https://datawhale.feishu.cn/docs/doccn0AOicI3LJ8RwhY0cuDPSOc#),我们会尝试站在巨人的肩膀上,争取更进一步的去完善它。
## SQL基础
## 数据处理
[文字教程](https://github.com/datawhalechina/wonderful-sql)
SQL是一种广泛应用于关系型数据库管理系统的编程语言。有的人可能会有疑问为什么要学数据库或者数据库到底要干嘛
首先我想介绍一下SQLSQL是一种广泛应用于关系型数据库管理系统的编程语言。有的人可能会有疑问为什么要学数据库或者数据库到底要干嘛
如果你知道一些基本的在计算机内的组织数据的方式,从微观上来说,可能是所谓的数组,链表,树之类的。
@@ -38,10 +40,34 @@ SQL短短的几句语言找出符合以下看起来非常复杂的需求
2. 找到123航班的没有托运行李的乘客
3. 找到今年四月所有预定了123航班的往返航程的乘客并且他们定的内容是同一架飞机并且他们要的座位都靠窗
如果你要自己设计一个数据结构,那可能会非常复杂,用好的组织方式把他拍出来甚至进行增删改查甚至是四个人同时增删改查的工作。
我在这里配上一段SQL代码的例子他的含义真计算每个客户的总订单的价格大伙看个乐子就行
因此,如果你有这方面的需求,或者说你很好奇这种组织形式,欢迎你去学习这篇课程
-- 查询所有订单中的客户信息和订单总价
SELECT customers.name, SUM(orders.total_price)
FROM customers
INNER JOIN orders
ON customers.id = orders.customer_id
GROUP BY customers.id;
-- 这是一个使用INNER JOIN和GROUP BY的查询示例。INNER JOIN用于将customers和orders表连接在一起通过customer_id列的匹配。```
如果你要自己设计一个数据结构那可能会非常复杂用好的组织方式把他拍出来甚至进行增删改查甚至是四个人同时增删改查的工作也就是说数据库这个工具将替你封装非常多本身很复杂的操作如果你用excel去解决这个问题
打开Excel并导入大量的数据表
在一个新的工作表中,输入以下公式:
=SUMIFS(orders!total_price,orders!customer_id,customers!id)
在同一工作表中,输入以下公式:
=VLOOKUP(A2,customers,2,FALSE)
将第2步和第3步的公式复制到下面的单元格中以计算所有客户的订单总价和名称。
如果你要操纵的数据很多excel就很难完成这个工作
但如果是较为简单的操作,数据分析师也很喜欢excel为什么我放这么后面因为我觉得可能你也不想看hhhh但你被一堆数据折磨得时候如果你还记得这篇文章可以速成一下
Excel:[文字教程](https://github.com/datawhalechina/free-excel) [视频教程](https://www.bilibili.com/video/BV1r64y1h75T)