On Interview tech skills basics bias - 偏差 -> 期望值和真实值 之间的差 - 描述模型的拟合能力 模型的复杂度不够 variance - 方差 -> 模型预测的离散程度 - 描述模型的稳定性 过拟合, 复杂度过高 减少测试误差的策略统称为 正则化方法 神经网络的拟合能力强,因此 训练误差(偏差)比较小,但 过强的拟合能力会导致方差较大, 也就是测试误差大 梯度下降法 是用损失函数对所有参数的梯度来寻找局部最小值 反向传播算法是用梯度方法, 用链式法则对参数求导 非线性激活函数是为了向网络中加入非线性因素,加强网络的表示能力 dropout是CNN中防止过拟合提高效果的一个大杀器 word2vec是“predictive”的模型 - 根据context预测中间的词汇,要么根据中间的词汇预测context 而GloVe是“count-based”的模型 module 监督学习 - Y = f(X) social 請問我返呢份工之前,仲有乜嘢要準備/學習? System Analyst /ə'næləsɪs/ opportunity lscm - in the logistics, supply chain, e-Commerce and related industries reference