数据科学不仅仅是机器学习和统计学,而且也不全是关于预测。 它甚至不是一门完全包含 STEM(科学,技术,工程,和数学)所有领域的学科 (Meng, 2019)。 但有一件事我们可以非常自信地断言,那就是数据科学始终与 数据 有关。 我们写这本书有两重目标:
我们将在 Section 2 章节讨论为什么 Julia 对于数据科学来说是一门相当高效的语言。 现在将注意力继续转向数据。
根据 维基百科,数字素养的正式定义是 阅读、理解、创建和使用数据进行信息交流的能力。 我们也喜欢这个非正式的理解,即作为一个具有数字素养的人,你不会对大量数据感到不知所措,相反地可以使用它来做出正确的决策。 因此,数字素养可以被视为一种具有高度竞争力的技能。 本书将讨论 数字素养的两个方面:
DataFrames.jl
操作数据 (Section 4)。 你将在本章学到如何:
filter
和 subset
筛选数据。Makie.jl
可视化数据 (Section 5)。 你将在本章学到如何:
Makie.jl
后端绘制数据图。