附件:设置1:设置2:任韬设置3:本书详细介绍了数据准备的相关基础知识, 第1章和第2介绍了数据从何而来, 如何得来, 数据形式如何的具体问题。通过梳理经济社会领域中数据常见来源, 总结了如何通过观察和调查、数据库、网络爬取和日志数据等常用方法获取数据。此外还介绍了以集合数据类型为主要特征的结构化和以音视频等为主要特征的非结构化数据的基本处理方式。第3章到第10章主要介绍数据准备过程中使用的常见方法, 包括数据编码、数据清洗、数据插补、数据配平、数据重构、数据变换、数据缩放和数据规约等具体内容。每一个章节都会详细介绍这些内容中的具体方法及其编程实现。摘要:有书目