2-3 小时预计学习时间
先让数据干净、完整、可识别
Python 数据研究的第一步,是把数据准备好。常见字段包括日期、开盘、最高、最低、收盘等价格字段和成交量。入门阶段可以先使用 CSV 或 Excel,因为它们更容易检查结构。
- 日期是否按时间顺序排列。
- 是否有缺失值或重复记录。
- 价格字段是否完整,格式能否被 Python 正确识别。
- 成交量是否存在明显异常。
- 不同字段是否对齐到同一时间点。
数据没处理好,后面的指标、研究信号和历史验证都会跟着出错,所以数据预处理是整个研究流程的地基。
把原始价格加工成可分析变量
特征是从原始数据里加工出来的新变量,用来帮助观察市场状态。常见特征包括价格变化幅度、移动平均值、波动范围、成交量变化和高低区间。
- MA 和 EMA:观察一段时间内的平均价格变化。
- RSI:观察短期强弱状态。
- ATR:观察价格波动范围。
- MACD:观察趋势变化节奏。
- 区间特征:观察价格与近期高低范围之间的关系。
指标本身不保证结果正确,它的作用是把价格变化翻译成程序能判断的数值。
让条件变成可检查的记录列
有了特征和指标,就可以记录研究信号。提示不是操作建议,而是程序对某个条件是否满足的记录,方便后续统计和复盘。
- 收盘价与预设观察区间形成特定关系。
- 短期均线与长期均线形成特定关系。
- RSI 进入预设观察区域。
- 成交量高于过去平均水平。
- 价格重新回到某个重要区间内。
在 Python 里,提示通常记成一列数据,例如 1 代表条件满足,0 代表没有记录,负值代表反向观察状态。这样每个时间点都能被清楚记录。
把研究过程变成可查看资料
分析做完后,要把数据、指标和研究信号整理成表格或图表。结果只留在代码里,很难检查问题,也不利于后续复盘。
- 价格走势图和均线叠加图。
- 价格变化幅度和指标变化曲线。
- 研究信号出现位置。
- 基础统计结果和样本数量。
- CSV、Excel、图表图片或简短研究报告。
如果图上提示位置明显不符合预期,通常说明代码、数据或规则表达需要重新检查。
METHOD
学习方式
逐步理解
用截图加短文字讲每一步,帮助学习者看懂为什么要做数据读取、清洗、指标计算和输出。
完整流程
提供可运行的基础代码,覆盖数据读取、特征计算、研究信号记录和图表展示。
小型任务
读取价格数据、计算均线和变化幅度、记录简单观察提示,并输出图表。
了解课程安排 →教育内容 · 不构成个性化操作建议