在数据科学领域SAS在过去的五年里占有重要的地位,很多金融机构,银行,保险公司都是采用的SAS,这是得益于SAS的两个很明显的优势:第一个是大数据处理能力(当然目前R/PYTHON的mrl,以及IBM,AWS的云计算也是很快);第二个是标准化的报告,以及数据分析报告;这两个优势,后一个优势依然非常明显,很多科学的标准以及参数比较。 最近三年随着机器学习,神经网络,深度学习领域的开发,SAS逐步的落后了,开源领域的R/Python 占据了上风。在text mining , recommendation, deep learning,NLP 领域SAS 落后了很多,需要借助R.Python 外挂SWAT来实现SAS的这些应用。
SAS有两个落后点:封闭性决定了它跟不上时代的潮流,知识的传递性。很多SAS的工作人员大多都是中年人,在中国这种不擅长分享的文化中,SAS很多技能已经被藏起来了。可悲的是很多人接触不到SAS软件,很多人也因此望而止步。
作者分享自己成为SAS高手之路的学习文档以及对比R/SAS/PYTHON/SPARK2/H2O/TS/MXnet/Totch