专利名称:模型训练方法、装置及系统以及样本集优化方法、
装置
专利类型:发明专利
发明人:杜玮,张柯,王晓光,谢树坤,程孟力申请号:CN201511032578.6申请日:20151231公开号:CN106934413A公开日:20170707
摘要:本申请公开一种基于优化样本集的模型训练方法及装置,用于优化样本的特征值,改善训练后的模型的性能。该方法包括:获取样本集;针对每个样本的同一特征对应的特征值,利用分位点,确定对于所述特征的初始特征区间集;根据所述初始特征区间集中相邻特征区间与样本属性的相关程度的差异,确定是否对相邻特征区间进行合并,并得到最终特征区间集;根据所述最终特征区间集,以及所述每个样本在所述最终特征区间集中各个特征区间的所属情况,生成优化样本集;根据所述优化样本集进行模型训练。本申请还公开一种样本集的优化方法及装置,以及一种个人信用模型训练系统。
申请人:阿里巴巴集团控股有限公司
地址:英属开曼群岛大开曼资本大厦一座四层847号邮箱
国籍:KY
代理机构:北京国昊天诚知识产权代理有限公司
代理人:黄熊
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容