- 浏览: 44213 次
最新评论
-
james_lover:
行为分析应该是画像的一个子集吧。画像也包含用户关联分析,研究用 ...
《京东技术解密》不得不说之"用户画像" -
爱宝贝的虫:
我们这边也叫用户行为分析
《京东技术解密》不得不说之"用户画像" -
anlystar:
hattah 写道cat test.txt|awk '{pri ...
去哪网的一个面试题:shell统计日志中各IP 出现的次数 -
paladin1988:
我一直觉得HS的IPD流程很牛逼的了,当天的代码提交,find ...
回顾我经历的持续集成实践的不足 -
paladin1988:
当初面试这个题目的时候我直接放弃了,因为没用LINUX好久了, ...
去哪网的一个面试题:shell统计日志中各IP 出现的次数
文章列表
前言:较少关注javaeye搞得试读活动,因为自身知识有限,或不了解,或没兴趣。关注“京东技术”还是缘起4个月前失败的面试。
正文:
试读第17章节“少数派报告,大数据洞察未来”是真正吸引我的,因为过去6年BI的工作经历,对数据仓库,数据分析多少了解一些。现如今叫“大数据”,听起来高大上,我还是愿意叫"经营分析系统",简称“经分”,叫起来更亲切一些。
经分系统非常复杂,详细说起来估计10本“京东技术”也写不完。其中“用户画像”一节我逐字看一遍。书中做为“创新应用”来介绍用户画像,其实这个并不新鲜,很多企业都在做,但画像的 ...
package com.test.me;
import java.util.ArrayList;
import java.util.Collections;
import java.util.HashSet;
import java.util.List;
import java.util.Set;
import java.util.Stack;
import java.util.concurrent.locks.ReentrantLock;
public class Tree<T> {
class TreeNode {
private Tre ...
我们(指我和我的老婆)上代人都是农民,我们算是城市第一代移民,注定难,而且是会一直难,必须一直往上走,因为没根基,不往上走就会被冲到下游去,所以会一辈子劳心劳力。我们的儿子也注定难,因为一代人根基尚浅。我们的上一代人目标就是让我们上学,不再种地,他们已经完成了。我们的目标就是在城市扎根。要结合自己实际,想一步到位不可能,也不能只为了拼搏,忽略孩子内心。说白了,孩子也注定难,咱们这样的家庭根基太弱,尽力为下一代努力吧,但是两头得平衡。咱们根基弱,弱在两方面,一是经济,二是家族文化,所以孩子教育和性格培养绝对不能放松,要靠咱俩了,如何给孩子更好的熏陶。
去哪网的面试:数据量不大的话用awk最方便,但长时间没有用过了,忘记了awk数组的用法。
在这里复习一下。
假设数据格式为:
178.60.128.31 www.google.com.hk
193.192.250.158 www.google.com
210.242.125.35 adwords.google.com
210.242.125.35 accounts.google.com.hk
210.242.125.35 accounts.google.com
210.242.125.35 accounts.l.google.com
64.233.181.49 ...
转我在知乎上的一个回答,算是对大学的一个回忆吧。希望有空能再把专业课再看一遍。
==========================
http://www.zhihu.com/question/24774797
说说我当时的信息管理专业吧。我是我们学校第一届06届信息管理专业的学生,等我们这一届毕业后,信管专业取消了。这个专业是在学校管理学院的一个专业,同级的专业还有市场营销,工商管理,会计,经济专业。然后说说我专业的课程:
以经济,会计,管理,计算机为主线课程(课时最多),主要专业课程:宏观经济,微观经济; 会计,税法,财务;公司
过去了5年了,现在再来回顾当初做的持续集成实践似乎有些晚了,我的确脱离开发太久了。
暴经历:
09年公司刚开使推行持续集成时,我作为刚接触IPD流程不久的小白,对持续集成一无所知;同时作为组内的急先锋匆匆忙忙就上阵了。等到10年底持续集成即将在全公司推广的时候,我却离开了,可谓虎头蛇尾。
==============================
这里谈不足,主要是回顾持续集成实践一年多的时间里,我所做的工作的不足。
公司所用CI工具是CruiseControl的二次开发版本,基于ant做build。而此时我们的java 项目还是依赖 ...
最近在找工作。投了不少阿里的职位,昨天看到阿里准备开始招聘外包了 。
这个事件引起我很大的兴趣。
"为什么阿里到今天仍然坚持用自有人员开发,而不是用人力外包"。
IT企业核心代码,或者关键代码由自有 ...
刚刚接到阿里的一个电话面试,提到这个问题,一时间没回答上来。
这里对此问题作下分析:
首先这应该是一个发散性问题,考察面试者的问题分析能力和处理能力。
前提条件:
1:淘宝平台,与支付宝平台必然是解耦的。也就是说在淘宝创建订单过程中不可能是同步调用支付宝创建订单接口(同步调步使用两系统耦合太紧,时延太长,支付宝创建出错还将导致淘宝订购失败,这无法接受)。
2:虽然是异步调用,但实时性要求很高。(因为大量用户在淘宝订购之后会立即支付)
我的思路:
1:淘宝创建订单时,异步调用支付宝的创建订单接口。(或者使用消息中间件,如kafka)。支付宝收到订购消息,则创建 ...
原贴位置是:
http://www.cnblogs.com/lovecindywang/archive/2012/12/23/2829828.html
ITeye里有个转人家文章不注明的,看完写了个简评(发到自己blog里,省得给人打广告)
=====================================================================
前端在以前真的是小打小闹:写一些特效,交互。但自从Gmail之后,前端也开始往工程化的方向上走,前端开始越来越重要。工程化面临的问题(以前只有后端才有),前端也一样不落的全都遇到了。最首要的问题:多人协作问题。 ...
半月前,考虑做一个在线阅读页面。需要用来pdf2htmlEX(https://github.com/coolwanglu/pdf2htmlEX ,开源工具),刚开始一直编译不过去。今天记录一点小问题:关于字体识别。
如果系统没有安装字体时,pdf2htmlEX会默认隐藏该字段内容。转换的html没有内容。
通过修改源码:
./src/HTMLRenderer/font.cc
// TODO: this function is called when some font is unable to process, may use the name ther ...
Source address selection[http://linux-ip.net/gl/ip-cref/node155.html]
Linux 2.2 选择源 IP 地址使用以下三种机制:
1. 应用程序可以通过bind(2) 系统调用,应用至 sendmsg(2) 调用上,并通过辅助数据对象 IP_PKTINFO ,从而显式指定源 IP 地址。在这种情况下,操作系统内核仅仅检查其源 IP 地址是否正确,否则产生相应的错误。
2. 如果应用程序没有指定源IP 地址,包含源 IP 的路由表将决定数据包源 IP 地址,通过设置 ip route 命令的src 参数,从 ...
数据仓库技术中的MPP
数据仓库世界里面的massively parallel processing 大概定义: MPP 是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后,将各自部分的结果汇总在一起得到最终的结果。 首先MPP 必须消除手工切分 ...
背景: 程序使用1.6.2版本的axis2做WebService客户端调用。
代码:
public static Object sendRequest(Object req) throws AxisFault
{
String returnMsg = "";
RPCServiceClient serviceClient = null;
serviceClient = new RPCServiceClient();
Options options = serviceClient.getOptions();
EndpointReference ta ...
=====先吐嘈======
周五我的一篇通过招聘简章的描述分析用人单位用人需求的文章。因为被误当作非法招聘而删除。
心里很不爽。
========下面是正文==========
keepalived来做HA方案已经很成熟了,但基本都是对服务端做HA,比如Ngnix,通过服务端的冗余来消除单点故障。但也有很多场景需要对客户端做HA,比如最近工作就遇到了:
各个省公司要给集团公司发送非常重要的实时告警数据,要求很高的及时性,并且不可重复发送,不可漏发。 同时要接受收集团下发数据。
就这个需求,服务端接收集团数据使用keepaive ...
做开发这么多年了,最近跟一些新同事(比我年轻几岁)一起共事。发现在沟通和思考上存在很大的差异。
主要有两点:
1:需求分析由谁来做;
2:实现功能,还是解决问题;
举例来说:
1:需求 ...