📎AutoFE算子手册

算子列表

基础算子

f代表的是数字特征,c代表类别特征。

AggMin(f, c):特征c各类别中f的最小值

AggMax(f, c):特征c各类别中f的最大值

AggMean(f, c):特征c各类别中f的平均值

AggMedian(f, c):特征c各类别中f的中位数

AggVar(f, c):特征c各类别中f的方差

CrossCount([c1, c2, ..]):根据特征list聚合的计数,list长度大于等于2

Nunique(c1, c2):特征c2各类别中c1的唯一值计数

Entropy(c):特征c各类别的熵

Percentile(f):特征f各个数据的百分位

Combine(c1, c2):特征c1和特征c2的字符结合

Count(c):特征c各类别的计数

Equal(f1, f2):判断特征f1和特征f2是否相等

Min(f1, f2):取特征f1和特征f2相比的较小值

Max(f1, f2):取特征f1和特征f2相比的较大值

Sigmoid(f):对特征f进行sigmoid非线性变换

Round(f):对特征f进行四舍五入

Residual(f):保留特征f求小数点后的数

Softmax(f):有限项离散概率分布的梯度对数归一化

时序算子

f代表的是数字特征,w代表窗口数。

stddev(f, w):计算窗口内特征f的标准差

ts_max(f, w):计算窗口内特征f的最大值

ts_min(f, w):计算窗口内特征f的最小值

ts_mean(f, w):计算窗口内特征f的平均值

ts_sum(f, w):计算窗口内特征f的加和值

ts_rank(f, w):计算特征f当前值在在窗口内的排名(降序)

ts_argmax(f, w):计算窗口内特征f最大值位置索引(从0计数)

ts_argmin(f, w):计算窗口内特征f最小值位置索引(从0计数)

delay(f, w):获取窗口内特征f最早时间所对应的值

decay(f, w):计算窗口内特征f线性衰减和

delta(f, w):计算窗口内特征f最晚和最早时间所对应值的差值

correlation(f1, f2, w):计算窗口内特征f1和特征f2的相关系数

covariance(f1, f2, w):计算窗口内特征f1和特征f2的协方差

算子图示

AggMin(f, c)

表示特征c各类别中f的最小值

AggMin

AggMax(f, c)

表示特征c各类别中f的最大值

AggMax

AggMean(f, c)

表示特征c各类别中f的平均值

AggMean

AggMedian(f, c)

表示特征c各类别中f的中位数

AggMedian

AggVar(f, c)

表示特征c各类别中f的方差

AggVar

CrossCount([c1, c2, ..])

根据特征list聚合的计数,list长度大于等于2

CrossCount

Nunique(c1, c2)

表示特征c2各类别中c1的唯一值计数

Nunique

Entropy(c)

表示特征c各类别的熵

Entropy

Percentile(f)

表示特征f各个数据的百分位

Percentile

Combine(c1, c2)

表示特征c1和特征c2的字符结合

Combine

Count(c)

特征c各类别的计数

Count

Equal(f1, f2)

判断特征f1和特征f2是否相等

Equal

Min(f1, f2)

取特征f1和特征f2相比的较小值

Min

Max(f1, f2)

取特征f1和特征f2相比的较大值

Max

Sigmoid(f)

对特征f进行sigmoid非线性变换

Sigmoid

Round(f)

对特征f进行四舍五入

Round

Residual(f)

保留特征f求小数点后的数值

Residual

Softmax(f)

有限项离散概率分布的梯度对数归一化

Softmax

stddev(f, w)

计算窗口内特征f的标准差

stddev

ts_max(f, w)

计算窗口内特征f的最大值

ts_max

ts_min(f, w)

计算窗口内特征f的最小值

ts_min

ts_mean(f, w)

计算窗口内特征f的平均值

ts_mean

ts_sum(f, w)

计算窗口内特征f的加和值

ts_sum

ts_rank(f, w)

计算特征f当前值在在窗口内的排名(降序)

ts_rank

ts_argmax(f, w)

计算窗口内特征f最大值位置索引(从0计数)

ts_argmax

ts_argmin(f, w)

计算窗口内特征f最小值位置索引(从0计数)

ts_argmin

delay(f, w)

获取窗口内特征f最早时间所对应的值

delay

decay(f, w)

计算窗口内特征f线性衰减和

decay

delta(f, w)

计算窗口内特征f最晚和最早时间所对应值的差值

delta

correlation(f1, f2, w)

计算窗口内特征f1和特征f2的相关系数

correlation

covariance(f1, f2, w)

计算窗口内特征f1和特征f2的协方差

covariance

最后更新于

这有帮助吗?