avatar

司继春(慧航)

上海对外经贸大学·统计与数据科学学院

课程任务 - 上海车牌拍卖价格预测

上海车牌实行拍卖制度,本项目的目的在于对未来车牌的拍卖价格进行预测,以辅助车牌拍卖。

制度背景

上海车牌拍卖的简要背景介绍:

  • 提前一周,有关机构会发布本轮拍卖的警示价格以及投放牌照的数量。警示价格一般根据上一年度的拍卖情况确定,一年更新一次。

  • 根据上海车牌拍卖的制度,每次拍卖从早上10:30开始为首次出价时段,会进行第一轮报价,这一轮报价实际对最终结果不会产生影响,仅是一个“报名”的操作,必须按照当天官方给出的警示价格进行出价。

  • 11:00首次出价时段结束,进入修改出价阶段,此时就可以看到当天参与车牌拍卖的投标人数有多少。最后在11:30,报价截止,期间参拍人员可以进行两次修改报价。修改出价时段设有“目前数据库接受处理价格区间”,即目前数据库接受处理有效出价的价格区间,取可成交价的±300元。超出这个区间的价格将不被接受

  • 由于这一制度设计,修改报价往往集中在最后的10秒,即11:29:50之后。随着报价人数的增加,可成交价在10秒钟内会剧烈变动。如果投标人根据某一刻的信息给出一个投标价格,但是可成交价的变动会使得有效出价区间变动,从而投标价格可能落入有效出价区间之外,则报价失败。

  • 考虑到人工输入验证码等操作需要时间,网络传输也会有延迟,现实中无法做到在最后的几秒钟做出决策并提交价格。因而常见的策略往往是类似于“提前8秒根据当时的成交价格加800出价”,然后填写验证码并提交。根据这一策略,有时可能报价太低或者太高从而失败;或者猜中了最终价格,但是过早或者过晚提交了报价,未及时落入有效出价区间从而失败。

本项目的目的就是在车牌拍卖当天的11:00,根据历史信息计算今天最有可能的成交价格(最低成交价或者平均成交价),使用这一预测的价格进行出价。比如,如果预测最低成交价,可以自行在预测的基础上加0-300元作为出价;如果预测平均成交价,可以在此基础上加减100作为出价。

需要完成的工作

  1. 网址 https://chepai.alltobid.com/canpai.web/channels/34.html#grresult 中有上海车牌拍卖历年的数据,请搜集相关数据。需要特别注意的是,历年的警示价格并不包含在其中,如果需要使用警示价格,需要额外查找收集。
  2. 使用Stata对数据进行预处理操作(必要的数据变换等)
  3. 使用OLS,探索包括但不仅限于以下手段提高预测精度:
    • 最低成交价和平均成交价的预测效果
    • 是否取对数或者其他变换操作
    • 样本期间段选取
    • 多项式
    • 滞后的变量(只要是在当天11:01之前能获得的信息都可以作为自变量)
  4. 使用最近5个月的数据作为验证集,挑选效果最好的模型,并计算样本外等指标。
  5. 使用你认为最好的模型对下个月的价格做预测。
  6. 形成完整的技术报告,报告需要包括:
    1. 研究背景
    2. 数据的描述统计
    3. 模型构建
    4. 预测效果比较
    5. 最终结论

Vibe coding 指引

以上所有过程建议使用OpenCode、Claude Code及其他AI代码工具完成,包括最终的报告书写。但是需要注意:

  • 核心代码需要做完整的code review,必须亲自检查所有代码的正确性。
  • 如果使用AI辅助完成该项任务,需要额外提交一个“Prompt.md”,完整记录你从最开始到最后得到报告的所有提示词。

报告提交格式

所有文件打包为“学号姓名chepai.zip”,目录结构参考如下:

7668司继春chepai.zip/
├── codes
│   ├── 01_data_cleaning.do
│   ├── 02_descriptive.do
│   ├── 03_ols_models.do
│   ├── ……
│   ├── Data // Stata数据文件夹
│   ├── Raw // 原始数据文件夹
│   └── Results // 结果文件夹
├── Prompt.md
├── Report.md
└── Report.pdf