> For the complete documentation index, see [llms.txt](https://yisichangtian.gitbook.io/yisichangtianml/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://yisichangtian.gitbook.io/yisichangtianml/an-li-fen-xi/chang-tian-ml-gong-kai-shu-ju-ji.md).

# 长天ML公开数据集

&#x20;       [长天ML公开数据集](https://changtianml.com/dataset/)包含了许多我们逸思长天团队调研的各行业的开源数据集，每个数据集都包含了数据本以及数据的源信息。

## 如何获取长天ML数据集？

**方式一：**&#x901A;过链接直接下载

&#x20;       在浏览器中数据输入相应的网址，即可进行下载。

**方式二：**&#x4F7F;用changtianml python包进行数据下载

&#x20;       这里假定用户已经按照好了[Anaconda](https://www.anaconda.com/)环境，该环境是用于快速安装Python环境的工具，然后执行如下命令搭建预测环境。

```python
# 创建Python虚拟环境
conda create -n changtian python==3.10 -y
# 激活虚拟环境
conda activate changtian
# 安装预测框架依赖
pip install changtianml -i https://pypi.tuna.tsinghua.edu.cn/simple/
```

&#x20;       然后创建一个python文件（以.py为后缀的文件）。

```python
from changtianml import load_dataset

# 指定数据集对应的字符串，具体可查询附录中表格进行下载
obj = load_dataset('stock_info') # load_dataset方法会返回的是一个类
# 获取数据
data = obj.data
# ...
```

## 附录

<table><thead><tr><th width="81">序号</th><th width="220">数据集名称</th><th width="306">changtianml本地包加载字符串</th></tr></thead><tbody><tr><td>1</td><td><a href="https://changtianml.com/dataset/public/stock_info/">股票信息</a></td><td>stock_info</td></tr><tr><td>2</td><td><a href="https://changtianml.com/dataset/public/flight_price/">机票价格</a></td><td>flight_price</td></tr><tr><td></td><td></td><td></td></tr></tbody></table>
