数据格式如下:三年中313个城市对313个城市的贸易发生概率(miftrade),概率小于0.5时logit值为0否则为1
miftrade logit orig dest year
.1701019 0 株洲 枣庄 2015
.1398723 0 龙岩 抚顺 2017
.0479942 0 白山 陇南 2017
.0089773 0 甘孜 厦门 2015
.0539768 0 平凉 七台河 2017
.0884007 0 长春 通辽 2015
.0269027 0 无锡 抚顺 2015
.2817783 0 张家口 黄冈 2015
.3075978 0 淮南 宣城 2012
.0253046 0 宣城 贺州 2012
.1548748 0 青岛 佳木斯 2012
.0606074 0 佳木斯 济宁 2012
.1402334 0 呼伦贝尔 黑河 2012
.0602577 0 呼和浩特 黑河 2012
.0024159 0 温州 七台河 2012
.0732688 0 抚州 克拉玛依 2017
.2672786 0 眉山 枣庄 2012
.1091199 0 汉中 吕梁 2015
.2021656 0 凉山 洛阳 2015
.122535 0 随州 贵阳 2015
.5376408 1 巴彦淖尔 合肥 2012
.9264405 1 株洲 信阳 2017
.9338673 1 清远 长治 2017
.9641673 1 平顶山 宁德 2017
.8167474 1 商丘 菏泽 2012
.815112 1 荆州 兴安盟 2017
.8977902 1 泰安 呼和浩特 2017
.6108046 1 盐城 荆州 2015
.705022 1 岳阳 黄石 2015
.519218 1 六安 漯河 2015
.9701766 1 聊城 海南 2017
.7516693 1 安阳 萍乡 2017
.9044015 1 衡水 石家庄 2015
.575397 1 喀什 恩施州 2017
.9500041 1 鹰潭 湖州 2017
.6562896 1 阳江 宜昌 2012
目前想要进行的处理是,不管logit=1的数据只处理logit为0时,先根据year和orig分组(共939组):每一年每一个orig城市对其他313个dest城市,然后在每一组中筛选出概率最大的十个,将这十个的logit概率变为1