📎AutoFE算子手册
算子列表
基础算子
AggMin(f, c):特征c各类别中f的最小值
AggMax(f, c):特征c各类别中f的最大值
AggMean(f, c):特征c各类别中f的平均值
AggMedian(f, c):特征c各类别中f的中位数
AggVar(f, c):特征c各类别中f的方差
CrossCount([c1, c2, ..]):根据特征list聚合的计数,list长度大于等于2
Nunique(c1, c2):特征c2各类别中c1的唯一值计数
Entropy(c):特征c各类别的熵
Percentile(f):特征f各个数据的百分位
Combine(c1, c2):特征c1和特征c2的字符结合
Count(c):特征c各类别的计数
Equal(f1, f2):判断特征f1和特征f2是否相等
Min(f1, f2):取特征f1和特征f2相比的较小值
Max(f1, f2):取特征f1和特征f2相比的较大值
Sigmoid(f):对特征f进行sigmoid非线性变换
Round(f):对特征f进行四舍五入
Residual(f):保留特征f求小数点后的数
Softmax(f):有限项离散概率分布的梯度对数归一化
时序算子
stddev(f, w):计算窗口内特征f的标准差
ts_max(f, w):计算窗口内特征f的最大值
ts_min(f, w):计算窗口内特征f的最小值
ts_mean(f, w):计算窗口内特征f的平均值
ts_sum(f, w):计算窗口内特征f的加和值
ts_rank(f, w):计算特征f当前值在在窗口内的排名(降序)
ts_argmax(f, w):计算窗口内特征f最大值位置索引(从0计数)
ts_argmin(f, w):计算窗口内特征f最小值位置索引(从0计数)
delay(f, w):获取窗口内特征f最早时间所对应的值
decay(f, w):计算窗口内特征f线性衰减和
delta(f, w):计算窗口内特征f最晚和最早时间所对应值的差值
correlation(f1, f2, w):计算窗口内特征f1和特征f2的相关系数
covariance(f1, f2, w):计算窗口内特征f1和特征f2的协方差
算子图示
AggMin(f, c)

AggMax(f, c)

AggMean(f, c)

AggMedian(f, c)

AggVar(f, c)

CrossCount([c1, c2, ..])

Nunique(c1, c2)

Entropy(c)

Percentile(f)

Combine(c1, c2)

Count(c)

Equal(f1, f2)

Min(f1, f2)

Max(f1, f2)

Sigmoid(f)

Round(f)

Residual(f)

Softmax(f)

stddev(f, w)

ts_max(f, w)

ts_min(f, w)

ts_mean(f, w)

ts_sum(f, w)

ts_rank(f, w)

ts_argmax(f, w)

ts_argmin(f, w)

delay(f, w)

decay(f, w)

delta(f, w)

correlation(f1, f2, w)

covariance(f1, f2, w)

最后更新于
这有帮助吗?