Data Science

引力波数据探索:编程与分析实战训练营

Gravitational Wave Data Exploration: A Practical Training in Programming and Analysis

Docker 简易入门教程

此文是为自己学习 Docker 为未来的自己看的 Note,所以内容是很基础的,并且内容有相当一部分是转载和 copy 自其它牛人的博文等其他技术资料。所以写作此文的目的,就是为了降低个人搜索和查阅的麻烦,每学一手,就记一点。

Ray Tutorial

Ray is a flexible, high-performance distributed execution framework.

Centos7/CUDA-9.2/cuDNN-7.3/MXNet-cu92/Floydhub 深度学习环境配置手册

记录一次自己手动配置深度学习 Linux 环境的笔记

S_Dbw 聚类评估指标(代码全解析)

此文的 motivation 来自于近期接的某无监督 k-means 聚类项目,并计划是用基于 K-means 算法的 [`k-prototypes`](https://github.com/nicodv/kmodes) 聚类算法来打发了事。为了对聚类结果给出合理靠谱的评估评价,最终决定主要参考 `S_Dbw` 评估指标,并且打算写作此文,非原理性的解析 `S_Dbw`。

数据科学入门之我谈 (2018)

匆匆又一年,入坑数据科学领域已有两年。除了每日的科研之余,也要时刻地学习补充新知识,提高技能,于是又有了一些新的体会和感慨,分享给更多打算入门数据科学和人工智能(AI)领域的朋友,希望大家能少一些弯路,少一些迷茫,少一些无助。

为啥一定用残差图检查你的回归分析?

究竟什么是残差图?到底该怎么分析残差图呢?