subtitle
Hadoop的入门 Hadoop的入门
概述Hadoop自推出以后在互联网快速发展的背景下得到了许多公司的认可,已然成为大数据的基础处理平台甚至是行业标准。Facebook,Amazon,Yahoo等等公司都在自己的系统中构建了基于Hadoop的处理平台。除了最基本的数据处理功能
2018-01-22
在Python中使用 numpy 在Python中使用 numpy
生成[0, 1) 区间的随机数组 1np.random.rand(5)
2018-01-17
impala hive sql 使用中的常见查询与统计操作 impala hive sql 使用中的常见查询与统计操作
概述本篇主要是记录impala hive sql 使用中的常见查询与分析函数 数据引用地址博客引用地址 数据样本 1234567891011121314cookie1 2015-04-10 1cookie1 2015-04-11
2018-01-10
Create a time dimension table in pure hive SQL Create a time dimension table in pure hive SQL
Create a time dimension table in pure hive SQLWithout further ado, here is the full SQL to create a table giving you one
2018-01-10
使用Python pandas 中的统计 使用Python pandas 中的统计
pandas 基本删选计算 类似切片 df[1: 3] df.loc[] 1df.loc[df['enumHouseType'] == 7, ["id","enumHouseType&qu
2017-12-29
关于promise的思考 关于promise的思考
本篇内容是翻译自We have a problem with promises水平有限,希望大家查看原文,不吝赐教。 各位JavaScript开发者,是时候承认我们对promise还是有些错误的认识,并不是说promise本身有问题。p
2017-11-28
网站数据分析中 UV/IP/PV/VV感念 网站数据分析中 UV/IP/PV/VV感念
UV(Unique visitor)是指通过互联网访问、浏览这个网页的自然人。访问您网站的一台电脑客户端为一个访客。00:00-24:00内相同的客户端只被计算一次。一天内同个访客多次访问仅计算一个UV。 IP(Internet Proto
2017-11-03
花名-英文名-花语收集 花名-英文名-花语收集
做花名收集的初心曾在一家公司工作的时候,所有的项目名称或者服务器名称都以一种酒的名称结尾,算是一种命名规范,觉得很有意思。比如有s-Vodka,p-Brandy ,Whisky…… 所以以下就有了一些花名的收集,作为以后有意思的命名。 花名
2017-08-27
初识推荐系统 初识推荐系统
推荐系统概述推荐系统是利用上下文,根据当前用户所处的环境,根据信息的特点来决定给你推荐什么内容和商品。 推荐系统在本质上是一个信息检索的系统。它和搜索最大的区别是,搜索是主动式的,根据关键词和引擎参数、搜索引擎召回、机器学习排序,决定给你看
使用js机器学习库了解简单线性回归 使用js机器学习库了解简单线性回归
一元线性回顾概述回归分析(Regression Analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析
10 / 12