数据量化研究 · 模块一

Python 数据研究基础

掌握数据处理、指标计算与数据研究常用工具。

2-3 小时预计学习时间
入门进阶课程难度
基础代码能力前置要求
← 返回数据量化研究课
一、数据获取与预处理

先让数据干净、完整、可识别

Python 数据研究的第一步,是把数据准备好。常见字段包括日期、开盘、最高、最低、收盘等价格字段和成交量。入门阶段可以先使用 CSV 或 Excel,因为它们更容易检查结构。

  • 日期是否按时间顺序排列。
  • 是否有缺失值或重复记录。
  • 价格字段是否完整,格式能否被 Python 正确识别。
  • 成交量是否存在明显异常。
  • 不同字段是否对齐到同一时间点。

数据没处理好,后面的指标、研究信号和历史验证都会跟着出错,所以数据预处理是整个研究流程的地基。

二、特征与指标计算

把原始价格加工成可分析变量

特征是从原始数据里加工出来的新变量,用来帮助观察市场状态。常见特征包括价格变化幅度、移动平均值、波动范围、成交量变化和高低区间。

  • MA 和 EMA:观察一段时间内的平均价格变化。
  • RSI:观察短期强弱状态。
  • ATR:观察价格波动范围。
  • MACD:观察趋势变化节奏。
  • 区间特征:观察价格与近期高低范围之间的关系。

指标本身不保证结果正确,它的作用是把价格变化翻译成程序能判断的数值。

三、研究信号生成与记录

让条件变成可检查的记录列

有了特征和指标,就可以记录研究信号。提示不是操作建议,而是程序对某个条件是否满足的记录,方便后续统计和复盘。

  • 收盘价与预设观察区间形成特定关系。
  • 短期均线与长期均线形成特定关系。
  • RSI 进入预设观察区域。
  • 成交量高于过去平均水平。
  • 价格重新回到某个重要区间内。

在 Python 里,提示通常记成一列数据,例如 1 代表条件满足,0 代表没有记录,负值代表反向观察状态。这样每个时间点都能被清楚记录。

四、结果展示与文件输出

把研究过程变成可查看资料

分析做完后,要把数据、指标和研究信号整理成表格或图表。结果只留在代码里,很难检查问题,也不利于后续复盘。

  • 价格走势图和均线叠加图。
  • 价格变化幅度和指标变化曲线。
  • 研究信号出现位置。
  • 基础统计结果和样本数量。
  • CSV、Excel、图表图片或简短研究报告。

如果图上提示位置明显不符合预期,通常说明代码、数据或规则表达需要重新检查。

METHOD

学习方式

图文教程

逐步理解

用截图加短文字讲每一步,帮助学习者看懂为什么要做数据读取、清洗、指标计算和输出。

代码示例

完整流程

提供可运行的基础代码,覆盖数据读取、特征计算、研究信号记录和图表展示。

实操练习

小型任务

读取价格数据、计算均线和变化幅度、记录简单观察提示,并输出图表。

了解课程安排 →教育内容 · 不构成个性化操作建议