note.wcoder.com
wcoder
GitHub
Home
../
分类和回归
基本统计
推荐
数据类型
最优化算法
特征抽取和转换
聚类
降维
LICENSE
README.md
spark-logo-trademark.png
SUMMARY.md
数据类型
基本统计
summary statistics(概括统计)
correlations(相关性系数)
tratified sampling(分层取样)
hypothesis testing(假设检验)
random data generation(随机数生成)
Kernel density estimation(核密度估计)
协同过滤
交换最小二乘
分类和回归
线性模型
SVMs(支持向量机)
逻辑回归
线性回归
广义线性回归
朴素贝叶斯
决策树
组合树
随机森林
梯度提升树
生存回归
保序回归
聚类
k-means算法
GMM(高斯混合模型)
PIC(快速迭代聚类)
LDA(隐式狄利克雷分布)
二分k-means算法
流式k-means算法
最优化算法
梯度下降算法
拟牛顿法
NNLS(非负最小二乘)
带权最小二乘
迭代再加权最小二乘
降维
EVD(特征值分解)
SVD(奇异值分解)
PCA(主成分分析)
特征抽取和转换
特征抽取
TF-IDF
Word2Vec
CountVectorizer
特征转换
Tokenizer
StopWordsRemover
n-gram
Binarizer
PolynomialExpansion
Discrete Cosine Transform (DCT)
StringIndexer
IndexToString
OneHotEncoder
VectorIndexer
Normalizer(规则化)
StandardScaler(特征缩放)
MinMaxScaler
MaxAbsScaler
Bucketizer
ElementwiseProduct(元素智能乘积)
SQLTransformer
VectorAssembler
QuantileDiscretizer
特征选择
VectorSlicer
RFormula
ChiSqSelector(卡方选择器)
← Previous
Next →
Less
More