本文由 资源共享网 – ziyuan 发布,转载请注明出处,如有问题请联系我们!开源量化交易回测框架 SimTradeLab 生态系统中生成的模拟交易数据集

资源语言: 中文
“simtradelabdata2025_parquet.zip”是开源量化交易回测框架 SimTradeLab 生态系统中生成的模拟交易数据集,由 GitHub 用户 kay-ou 维护,属于前瞻性仿真数据(标注为2025年),当前时间为2026年,该数据集用于策略开发、模型训练与回测验证,非真实市场数据,亦非商业产品。
数据集来源与背景 项目归属:该文件源自开源项目 SimTradeLab(GitHub: kay-ou/SimTradeLab),其配套数据工具为 SimTradeData(GitHub: kay-ou/SimTradeData)。 数据性质:为合成仿真数据,模拟金融资产(如股票、期货)在2025年的时间序列行为,包含价格、成交量、时间戳、策略信号等结构化字段,适用于机器学习模型训练与量化策略回测。 存储格式:采用 Apache Parquet 列式存储格式,具备高压缩比、高效列查询、与大数据工具(如 DuckDB、Pandas、PyArrow)兼容等优势,适合处理高频金融时序数据。 数据结构与字段推测
虽无官方字段说明文档,但基于 SimTradeLab 的设计目标与 Parquet 在量化领域的通用实践,该数据集可能包含以下字段(推测):
表格 字段名 类型 含义说明 timestamp datetime64[ns] 交易时间戳,精确至秒或毫秒 symbol string 资产代码,如 AAPL、BTCUSDT open float64 开盘价 high float64 最高价 low float64 最低价 close float64 收盘价 volume float64 成交量 vwap float64 加权平均价格 signalema12 float64 12周期EMA策略信号 signalrsi float64 RSI指标值 labelnext_return float64 下一周期收益率(用于监督学习)
⚠️ 实际字段需通过代码加载后验证,无公开数据字典,建议使用 pandas.read_parquet() 或 pyarrow 进行探查。
使用方式与技术路径
该数据集需通过 Python 环境加载,典型使用流程如下:
python Copy Code import pandas as pd import zipfile
解压 ZIP 文件
with zipfile.ZipFile("simtradelabdata2025_parquet.zip", "r") as z: z.extractall("./simtradedata")
加载 Parquet 文件
df = pd.readparquet("./simtradedata/simtradelabdata_2025.parquet")
查看前5行
print(df.head())
查看列名与数据类型
print(df.dtypes)
推荐工具:pandas、pyarrow、DuckDB(支持直接查询 Parquet 文件,无需解压) 适用框架:SimTradeLab、Backtrader、vn.py、Zipline 获取途径与风险提示 合法来源:该数据集未在 Kaggle、data.gouv.fr 等公开平台发布,唯一可信来源为 SimTradeLab 项目仓库。请通过其 GitHub 项目页(kay-ou/SimTradeData)查看是否提供 download 接口或示例数据。 风险警告:网络流传的“simtradelabdata2025_parquet.zip”下载链接多为第三方托管,可能携带恶意代码或损坏文件,请勿从非官方渠道下载。 法律合规:该数据为仿真合成数据,不涉及真实交易信息,无版权或隐私风险,可用于学术研究与个人学习。 学习资源推荐
与《开源量化交易回测框架 SimTradeLab 生态系统中生成的模拟交易数据集》相关的《数据》
歇后语数据(14032条)
共有14032条 歇后语数据txt格式,一行一条阿斗当皇帝 软弱无能阿斗的江山 白送阿二(民间传说中的呆头呆脑、自作聪明的人)炒年糕 费力不讨好;费劲不落好阿公吃黄连 苦也(爷)阿拉伯数字8字分家 零比零(O:O)阿奶抱孙子 老手阿婆的鞋 老样子阿婆留胡子 反常阿庆嫂倒茶 滴水不漏挨鞭子不挨棍子 吃软不吃硬挨打的狗去咬鸡 拿别人出气挨打的山鸡 顾头不顾尾挨了巴掌赔不是 奴颜媚骨挨了棒的狗 垂头丧气...
20 82743 0
微博评论情感数据集(清洗之后的,有标注,中文,csv格式)
共有26万条以上,csv格式文档,有0:喜悦、1:愤怒、2:厌恶、3:低落
10 81836 0
申银万国行业分类标准json数据(附pdf)
行业分类按照一级行业、二级行业、三级行业的顺序进行逐级认定。行业分类的认定过程一般遵循如下步骤:(1)若上市公司的投资收益超过营业利润,考虑该投资收益来源的行业背景集中度情况,如集中地来自于某一个行业且满足(2)中所述情况,则归入该行业:如果不是集中地来自于某一个行业,根据(2)-(5)进行判断。(2)考虑上市公司最近2年的营业收入和营业利润的构成,当某一行业的收入和利润占该公司营业收入和营业利润...
5 11005 0
四川省地质灾害数据(地理信息系统(GIS)中的空间数据)
地理信息系统(GIS)中的空间数据四川.dbf四川.pr四川.sbn四川.sbx四川.shp四川.shx推荐地理信息系统(GIS):ArcGIS(由ESRI开发)、QGIS、MapInfo、GRASS GIS
5 100384 0

