本文档适用于南开大学周恩来政府管理学院2017年上半年的高级数据分析及R语言实现研究生课程,主要作为一些基础内容索引,以便按图索骥。阅读此文档时,请保持电脑网络联接处于正常状态。

NOTE:课程高度依赖同学们的自学能力、英语水平、软件爱好和心理韧性,请慎重考虑。

课程内容

请忽略课程名称中的“高级”两字,这里只有基础,没有高级。基本原则:软件操作为主、统计知识为辅。重点介绍以下四方面开源软件环境的基础操作:

  • RRstudio的基础应用:
    • Hadley系列数据包的应用。
    • 回归与方差分析的操作。
    • 效应值与功效估算。
    • 随机化检验与Bootstrap法置信区间。
    • 其他相关统计内容。
  • 基于Markdown的日常文本写作。
  • 基于LaTeX的数学公式编辑。
  • 基于GitHub的文件共享及社会化编写操作。

软件准备

R的安装

请从R官网下载适合自身操作系统的R最新版本。为追求统一,本次课程可固定使用R 3.3.2版本(2016-10-31发布)。

关于R软件这里不再做任何介绍,请自行查阅资料。

Rstudio的安装

Rstudio是集成了诸多R本身不具备的便捷功能的编辑器。请从Rstudio官网下载适合自身操作系统的Rstudio最新版本。为追求统一,本次课程可固定使用RStudio 1.0.136版本(2016-12-21发布)。

课程主要利用RstudioRMarkdown文档进行写作,其格式请见其官方说明参考手册(cheatsheet)。请在阅读完下述Markdown语法后再阅读此参考手册。

初学者建议先观看雪晴数据网提供的免费Rstudio视频教程。该网站还提供多个R语言相关视频教程,可自行观阅。

LaTeX语言

LaTeX是生成高质量的科技和数学类文档的标记语言。它本身不是课程的核心内容,介绍一些相关知识主要为方便在RMarkdown文档中编辑数学公式。课程本身不涉及过多的LaTeX细节。

如果有意建立符合专业标准的数学类文档,可安装相关LaTeX引擎。为追求统一,建议使用TexLive 2016系统,可从其官网下载安装。另外,本人使用TeXStudio作为编辑器,有意者可自行从其官网下载最新版本。

GitHub环境

可下载桌面版,也可直接网络登录。需要注册账户。想详细了解Git操作,请参考廖雪峰的在线教程。对本课程而言,此教程较长,可择要观看。

具体安装和调试细节请自行百度,课前最好安装调试完毕,第一次课上统一进行说明。部分安装操作说明请见本人的百度网盘链接

以上软件请选择默认安排在系统盘(通常为C盘)。

Markdown语言说明

Markdown是一种可以使用普通文本编辑器编写的标记语言。关于Markdown的简洁说明可参考相关网页,以下是一些推荐。

以上三个链接请大家自行仔细阅读,第三个文档请花10分钟左右的时间完成在线学习。Markdown语法不是课程本身的内容,但对于了解本课程文档的最基本格式具有根本性的作用。

上述每一个软件或语言环境都需要较长时间的学习和训练,课程中会以尽量清晰简洁的方式进行介绍,仍请做好一定的心理准备。

相关教材

课程所有内容均可在网上找到免费公开的版本。为阅读方便,可推荐(但不强求)以下书目:

  • 吕小康:《R语言统计学基础》(2017版,清华大学出版社)。
  • 卡巴科夫:《R语言实战》(2016版,人民邮电出版社)。
  • 薛毅、陈立萍:《R语言实用教程》(2014版,清华大学出版社)
  • 刘海洋:《LaTeX入门》(2013版,电子工业出版社)。
  • Bookdwon官网上的若干公开电子书籍。

购买原则:钱多则买,钱少可省。

本课程的系列文档将储存于本人GitHub目录,欢迎登陆查看和补充更正。

附:课程名单

学生名字 专业  性别 学号
武迪 应用心理学 2120161902
金淑娴 应用心理学 2120161898
刘书冰 应用心理学 2120161900
高田琪 社会学  2120161885
张潇逸 政治学理论 2120161844
张世瑾 应用心理学 2120161903
王婧妍 应用心理学 2120161901
刘奇 应用心理学 2120161899
赵晓繁 应用心理学 2120161904
汝怡昕 应用心理学 2120161905
侯茶燕 应用心理学 2120161897
郭琴 应用心理学 2120161896  
陶霞飞 社会学 2120161882
刘馨怡 行政管理 2120161922