Documentation ¶
Index ¶
- func EvaluateModelSuperParamByCV(sourceDataSet *common.DataSet, label string, alpha, amplitude float64, ...) float64
- func PreProcessDataSet(sourceDataSet *common.StandardizedDataSet, label string) *common.TrainDataSet
- func PredictByLocalInput(thetas, standardizedInput map[string]float64) float64
- func StandardizeDataSet(sourceDataSet *common.DataSet, label string) *common.StandardizedDataSet
- func StandardizeLocalInput(xbars, sigmas, input map[string]float64) map[string]float64
- func TrainModel(trainDataSet *common.TrainDataSet, alpha float64, amplitude float64, ...) *common.Model
Constants ¶
This section is empty.
Variables ¶
This section is empty.
Functions ¶
func EvaluateModelSuperParamByCV ¶
func EvaluateModelSuperParamByCV(sourceDataSet *common.DataSet, label string, alpha, amplitude float64, regMode int, regParam float64, cvMode int, cvParam int) float64
EvaluateModelSuperParamByCV 模型评估,通过RMSE(均方根误差)来评估 注意:每次在迭代之前进行预处理,而不是统一进行预处理
- sourceDataSet 原始样本数据 - label 目标特征名称 - alpha 训练学习率 - amplitude 训练目标值 - regMode 正则模式 - regParam 正则参数 - cvMode 交叉验证模式 - cvParam 交叉验证参数
func PreProcessDataSet ¶
func PreProcessDataSet(sourceDataSet *common.StandardizedDataSet, label string) *common.TrainDataSet
PreProcessDataSet 预处理标准化训练数据集 label表示计算损失函数时的目标维度
func PredictByLocalInput ¶
PredictByLocalInput 利用标准化过后的样本进行预测
func StandardizeDataSet ¶
func StandardizeDataSet(sourceDataSet *common.DataSet, label string) *common.StandardizedDataSet
StandardizeDataSet 将样本数据集合进行Z-score标准化处理,将均值变为0,标准差变为1 Z-score Normalization x' = (x - average(x)) / standard_deviation(x) 特别注意:对于逻辑回归,标签值不做标准化处理
func StandardizeLocalInput ¶
StandardizeLocalInput 使用训练得到的标准化模型参数,需要先对预测的数据进行标准化处理
func TrainModel ¶
func TrainModel(trainDataSet *common.TrainDataSet, alpha float64, amplitude float64, regMode int, regParam float64) *common.Model
TrainModel 模型训练,alpha是梯度下降法的学习率α, amplitude是目标收敛震荡幅度 使用正则化的方案来提升泛化能力(先验知识)
- trainDataSet 预处理过的训练数据 - alpha 训练学习率 - amplitude 训练目标值 - regMode 正则模式 - regParam 正则参数
Types ¶
This section is empty.