Why·Liam·Blog

人生若如初見

  1. 大数据是新技术 大数据是新的术语,但其海量数据分析的概念并不新。许多人,包括 Teradata 首席技术官 Stephen Brobst 在内认为,对于那些刚开始认识到数据价值的用户,大数据有一些误导。Brobst 表示:「大数据是一个长期项目,而不是 12 个月内,是 24~36 个月的世间情。」
  2. 大数据是一种商品 初次接触大数据概念,会认为它是一种特殊形式数据,独立于其他低端数据格式。但事实并非如此。「你能买一个数据库数据吗?」Gartner 杰出分析师 Donald Feinberg 说,「是的,你可以买到 100 台服务器,但是你可以购买大数据吗?因此,这不是一个市场。它只是 IT 市场的一部分。它价值 10 亿美元?是的,但它不是一个市场,它甚至不是一种商品,而且还不是新的。」
  3. 大数据是一个问题 这是一个近似半斤八两性质的公开辩题,但基于其基本形式,大数据具有巨大潜力,即使其没有被正确使用,或者甚至根本没有被使用。因此,只要数据存在,并且可在未来用一种有效的方法加以处理,就应该有机会存在。也是一个价格昂贵的机会,也许,但仍然有机会。数据问题是如何通过分析将其转化为清晰和实用的内容,这对企业是一个巨大的挑战。
  4. 你的数据只对你有用 据 Gartner 的统计,30% 的企业会在未来几年会找到一种方式来套现其所持有的数据。将用户数据出售给出价最高者会引起担心和恐慌,但十有八九都会受到保证或者威胁。
  5. 人们不关心你如何使用他们的数据 很多人并不喜欢针对性或相关性的广告,但基于大数据驱动的市场营销接下来的重点,这事事实。但当你进入一家商铺,你的手机开始震动,告你在竞争对手店可以更低价格买到同样的产品时,这个时候你就会想到所签约的服务商。即使是遭受恶评的利用人行为的无害化尝试也是具有一定价值的,其中伦敦的 WiFi Smartbin 就是一个典型的例子,它保持跟踪人们智能手机 MAC 地址,在广告风箱显示具有针对性的广告。不久伦敦城市管理公司意识到事情发生后,禁止了该行为,但这也不禁让我们联想到了 Facebook 所面临的 2000 万美元的 集体诉讼。
  6. 大数据不会降落在监狱里的你 在这一点上,我们正在涉及一个颇具争议的话题。但 Gartner 公司的 Feinberg 确信,将会有相当的数据采集会涉及该领域。「CIO 会有多少人会去坐牢?如果觉得我在开玩笑,那么我就做另外一个大胆性假设:我认为 Facebook 总裁会在他离开 Facebook 之前去坐牢。我不知道什么时间,但它会发生。」Feinberg 说,无论夸张与否,这都值得思考。
  7. 政府对你的社交媒体数据不感兴趣 许多人喜欢在 Twitter 上谩骂政客——反正他们也不会看到,对吗?也许是,但这对于了解选民的意向具有一定的参考价值,Feinberg 说。「奥巴马关心,因为他当选了,如果你看怎样当选的,他的团队使用社交数据和情感分析找出他不能胜出的目标对象。我不是说这他当选的唯一原因,但对于政府部门,社会资料和数据已经变得非常重要。」Feinberg 说。
  8. 你需要新的数据进行分析 当你有一个业务目标之后,且数据仓库被 0 和 1 填充满了之后,你就可以分析使用你的数据了。有研究表明,大多数企业已经开始使用大数据获取信息,一旦他们想到了一个问题,就试图通过大数据分析来解决问题。就像全球物流公司 DHL 早些时间像 V3 的记者所解释的那样,尽管此前在包裹投递的每一个阶段都有追踪,但是分析系统建立之前,没有办法利用这些数据。
  9. 有很多人以使用大数据 错了。这是一个世界性的难题。Gartner 统计数据表明,熟练的数据分析科学家如此缺乏,公司存在 75% 以上的大数据分析职位空缺。竞争惨烈,换句话说,这是一个很棒的职业。话虽如此,这也取决于你如何定义一个数据分析科学家。Tesco 公司的 Duncan Apthorp,一位大数据分析师表示,他所存在公司并不要求名牌院校,这意味着普通毕业生也很有机会。
  10. 大公司都知道他们在做什么 显然不是。根据 Gartner 对数百家企业案例的研究:「在 2016 年,财富 500 强 85% 企业将无法利用大数据获得竞争优势。」Teradata 的高级副总裁 Tasso Argyros 表示:传统商业智能是从一个明确定义的问题开始,对于大数据发现,你有一个起点,但它不是一个业务问题,它是一个业务目标。问题在于你不知道要问什么问题或要使用什么数据,只是说』看这些数据,让我们开始,这通常很容易会失败。所以,问题的答案是「不」,不是每个人都知道他们在做什么,很难制定出高效使用大数据的策略。

自:36 大数据

The Why·Liam·Blog by WhyLiam is licensed under a Creative Commons BY-NC-ND 4.0 International License.

WhyLiam创作并维护的Why·Liam·Blog采用创作共用保留署名-非商业-禁止演绎4.0国际许可证

本文首发于Why·Liam·Blog (https://blog.naaln.com),版权所有,侵权必究。

阅读全文 »

重构是一种对软件进行修改的行为,但它并不改变软件的功能特征,而是通过让软件程序更清晰,更简洁和更条理来改进软件的质量。代码重构之于软件,相当于结构修改之于散文。每次人们对如何对代码进行重构的讨论就像是讨论如何对一篇文学作品进行修订一样无休无止。所有人都知道应该根据项目的自身情况来对代码进行重构,而重构是无止境的。莫扎特从来不不对他的作品进行修订,特罗洛普对自己作品修订的恰到好处,大多数作家认为他们俩这样做都是合适的,但他们的合适对于你我来说未必是合适的。

最常见的基本重构方法可以归纳为两个方向。通过归纳方法将一个长的过程分解为小的可以重用的组件,和通过内联 (inline) 方法来消除那些不够份量的小方法。我们可以提炼方法来让大量的子类共享相同的功能特征,我们可以下放方法来让只有用到这些功能的子类才知道它们的存在。重构就是爬山,通过一步一步的小的提高来逐渐的改进整体的质量,但在重构时,我们如何知道哪种方法是上山的正确道路?

关于代码地形学的这个问题公认的方法有两种。去除有异味的代码和 重构成模式。如果能做到这样,当然是很好的。就像是纠正作文里的一个语法错误或不恰当的比喻。如果我们可以找到这些四处隐藏的有异味的代码,将它们重写成整洁的,条理的,结构化的形式,何乐而不为。但这些都是特殊情况。如果没有明显的模式来重构,或没有很直接的方法来去除代码异味,那该怎么办呢?

这才是我们如今编程艺术的中心问题,而很少人讨论这些。通常我们讨论这些问题时都是罗列出更多更长的有异味的代码模式的清单,但这并不是解决问题的方法。代码异味应该是我们公认的不好的东西,而不是那些置之不理也无妨的事情。我们经常会说到老板不给我们重构的机会,甚至代码有明显的异味,老板们认为这是浪费时间。并不是每个人都有懂软件的老板。我很吃惊为什么只有很少的讨论谈到点子上。。也许我这篇文章才说到问题关键处。

阅读全文 »

只需要在 post 的 markdown 文档里面适当位置加上 <!--more--> 即可。这样就不会在首页显示此代码以后的部分。另外,还会在首页的相同位置添加一个 read on 的链接,点击即可阅读全文。

参考 Image Tag

只需要在新的 post 的头步加入 published: false 即可。

阅读全文 »

最近有些同学让我分享我的博客主题,其实主题早已经放在 GitHub 上了。下面索性基于 我 Fork 的 Octopress,讲一下如何使用 Octopress 在 GitHub 上建博客。先来看看我的版本和原始版本的主要不同之处:

2012-04-13: 允许单篇文章独立引用 CSS 和 JS,具体文件内容变动见 commit0aa27bb05fcdbf

  1. .rvmrc 改成使用我机子上装的 Ruby 版本(1.9.3),Octopress 最低要求是 1.9.2。
  2. Gemfile 把源改成 ruby.taobao.org,去掉部分 gem 的版本号限制,咱都用最新的。
  3. Rakefile 用 haml 替换 markdown(这个根据自己喜好来,只要是被支持的),时间改成东八区的,降低主题对 custom 目录的依赖。
  4. _config.yml 这里都是一些定制化的配置信息,比如日期格式、永久链接、新浪微博等。
  5. plugins/sh_js.rb [新增] 代码高亮插件,具体介绍看:Using SHJS for Jekyll
  6. plugins/tag_generator.rb [新增] 其实 Jekyll 是支持 Tag 的,只不过 Octopress 目前没有官方插件支持,所以我自己搞了个,支持中文。
  7. .themes/blog/ [新增] 这个就是我博客的主题了。

OK,现在让我们正式开始。

GitRuby,然后就是把 Octopress 源码从 GitHub 上拉下来:

阅读全文 »

终于,耗时 N 天,把我的博客从 WordPress 转到了 Octopress,并且很无耻的托管到 GitHub 上面,免费高速~ 这篇文章教大家简单的 Octopress 的安装与使用。(如果你用的 Windows,你可能会碰到一堆雷⋯⋯强烈推荐 Linux 或者 Mac OS X)

Octopress 的安装不同于 WordPress,WordPress 是安装到服务器上面的,Octopress 是安装在你本地的(如果选择 Deploy 到 GitHub 上)。

首先需要准备的是 Ruby 环境:(下面教程均在 Mac OS X Lion 10.7.2 测试通过)

  1. 参考这篇文章,安装 GCC:http://www.memoryz.info/install-gcc-on-mac.html

如果你已经安装了 Xcode,则无需重负安装 GCC

阅读全文 »

markdown 语法快速成文,git 与 github 实时保存,jekyll 或 octopress 实时成书或者 showoff 实时成 ppt。入门略有门槛,但是习惯了,写作效率会好很多。以下以 octopress 为例,进行说明。

github,创建一个个人账号。假设叫做:rubyonchina。然后回到 ubuntu 或者 Mac 里面,仍然是在终端里面,输入:

按照默认提示一路确认,生成密钥之后,将生成的信息复制到 github 页面中,如下所示:

阅读全文 »

你在电话里说最近还在做那个梦,同样的一个男人,同样的情节,同样的最后牵不到的手。你说清醒的时候几乎想不起来这个人,没有恨意,也没有爱意,像个陌生人。可是不知道为什么,十几年了,他总是不定时的在梦里出现,重复着最初的相遇和最后的分离。

那一年你十八岁,是每天带着一群小萝卜头的孩子王。只是每日肥大的白色 T 恤和短裤加上短发平胸,看上去更像个清秀的小男生。那个时候我已经学会了穿飘逸的长裙不苟言笑,却喜欢和你一起没有目的地慢慢走。很多诧异的眼光吧,其实不止是情侣,即便是同性的好朋友太过不同的外在还是让人好奇。可这些与我们无扰。我们还是一样坚持一个旁若无人,一个玩世不恭。

只是突然有那么一天,你竟然在和我说话的时候脸红了,眼神飘向地面,你说你爱上一个人,一个男人。

你带我去见他,在他租来的画室。我记得那个男人站在背向阳光的地方,我看不清他的面目,却看得到你在我身边的殷切——你在乎我对他的观感。我微微向一边挪了挪,然后看到一个个子不高,带着眼镜,笑起来时候嘴角斜向一侧的平凡男子。格子衬衫有些发皱,手上有些没来得及洗净的油彩。我承认那刻的失望,尽管那是你的爱人。

阅读全文 »

2012 年 5、6 月,成都到拉萨,骑行 2200 公里,骑行去西藏。谨以此片铭记我的 2012,我的 21 岁,我的间隔年。献给我的朋友们。

曾经一个人走在陌生的旅途中 泪湿眼眶的那份感动。。当我们不再为当初一直激荡在内心的梦想澎湃时,当看着身边的朋友在为着生活、结婚、养儿育女、供房、买车。。朝九晚六的工作着。。并开始接受、迎合现实。。真的,一个人首先老去的是那份不顾一切、想走就走的心。。。我们有太多的无可奈何~趁年轻!

The Why·Liam·Blog by WhyLiam is licensed under a Creative Commons BY-NC-ND 4.0 International License.

WhyLiam创作并维护的Why·Liam·Blog采用创作共用保留署名-非商业-禁止演绎4.0国际许可证

阅读全文 »

作者: 符号

在电影《史密斯夫妇》中, 布拉德皮特曾说过:」what happens in the end… you start to miss the beginning.」一晃四年,光阴荏苒,当我厚着脸皮忝居 Vassar 学长、自己已然卷铺盖滚蛋却又看着一波新生正在接近之际,不禁想起刚入学还是小弟的时候,和当时大四学长一起吃的一顿饭。学长仙风道骨,当时已经手握大把 Top 10 研究生院的 offer,看着我这只初来乍到的菜鸟,悠悠地来了一句:「我一直觉得,你从大学之中得到什么,不取决于大学能够给你什么,而取决于你自己想从中获得什么。」

学长抛下这句话,飘然去了哈佛,留下我在大学四年间细细回味,如今想来,堪称我在大学期间得到的最受用的建议之一。Vassar 算是典型的文理学院(liberal arts college),在普通学校、文艺学校和二 B 学校之中介乎于文艺与二 B 之间。学什么学科的都有,尤以英语文学为盛,唯独理工科不怎么受待见。虽然受此影响我在历史、哲学、经济等学科打了一圈酱油,但最终还是决定学数学。两年后无论是申研究生院还是找工作,面试我的人前五句话中必然有一句:「你丫干嘛跑到 Vassar 学数学?」其实我们数学系反而粥多僧少,每年不到二十个学生能够享受所有的资源。即便去了一所数学教育质量更高的大学校,我个人所能分摊到的资源(比如教授的个人指导)却未必能比得上。每条路有每条路的走法,所以我在这所山村学校数学系的走法就是我与导师和教授的关系都还不错,借着他们的人脉认识了我这个领域的大牛教授,在她的指导下写了些东西,凭此去参加了一些学术会议,写了些论文……你能想象的节奏。好的机会和成就不会主动来找你,还是要自己一步步去实现。Vassar 众学科中当属表演系(drama)最强,全国驰名,而我对此一窍不通也不感兴趣。倘若当年手滑选择了大学能给我最多资源的表演系,只怕今天依然泯然众人,找不到人生方向。

再比如我大三半年去了牛津大学交流,这个看似高端大气的项目其实很水很轻松,每周规定上课时间 2 个小时,其它随意,期末成绩竟然还不计入大学四年总成绩。那么我们这些交流生这半年得到什么,显然就不取决于牛津能给我们什么,而是看我们自己想获得什么了。我有同学花了很多时间找实习找工作,各种准备、四处面试;也有同学游山玩水,游遍欧洲列国,增长一番见识。我则主要做了两件事:第一是利用牛津丰富的图书馆资源看了不少数学文献,借机写了篇论文,之后拿去参加学术会议,在通往 PhD 的不归路上一去不回头。第二则是狂练体能,每天绕着风景还不错的校园跑步,左三圈右三圈。刚回到瓦村那会儿隔天和校篮球队的人打两个小时的全场,满场飞奔毫无压力。同样是去牛津的交流生,我们各得其所,走了全然不同的路。

不过生活不像人民日报,处处顺心如意心想事成。满场飞奔打球的代价,就是我在大四第一学期结束的时候得了跟腱炎。这再次体现了一个让人略感不安的事实:岁月无情。如果你不是神童提前入学,大学毕业大概二十二三岁,和十七八岁的时候的体质已然大不相同。如果落下什么慢性伤病,那以后多半会一直与之相伴;反之如果养成健身的习惯,心肝脾肺肾全面达标,那么也大有可能为祖国健康工作五十年。

阅读全文 »

昨天,一群參加 青年創業暨交流計畫 — 一個由中華青年企業家協會發起、給學生參加、非常重視實作的創業培訓 — 的同學們來 appWorks 參訪。

他們事前做了很多功課,不知到去哪裡人肉搜索挖掘出了我這輩子所有人生軌跡,然後根據不同的階段擬出了幾十個問題,請我一一幫他們回答。大概聊了一個多小時吧,其實是蠻好的經驗,剛好也讓我回顧一下我這些年來闖蕩的歲月。最後我送他們一句話,也是我常常送給每一個創業人的:Hack, everything! 這句話我常常說,但是似乎一直沒有好好的解釋一下它的意思,我想我們今天就來聊聊這個話題。首先,我們得先定義一下「Hack」,Hack 這個字當名詞用時的意思,維基百科是 這麼說的

  1. 問「為什麼不能」,而不是「可不可以」 – 這世界上大多的規矩是在不同時空背景下設立的,所以你不應該被它們綁住,而是去了解環境條件是不是早已改變。
  2. 問別人「為什麼成功」,而不是「有多麼成功」 – 一般人只會專注在誰有多少錢、哪個人又住在帝寶,這些只是結果,你想要知道的是過程。
  3. 「為什麼失敗」,而不是「他們太笨」 – 我知道你很聰明,但是別人也不笨,重點是他們為什麼失敗,這是你很重要的功課。
  4. 「測試」界線,而不「接受」界線這篇文章 就是最好的例子,我知道它可能會超出界線,但是我非得試試。
  5. 「人」也是一種系統 — 人性也是一個系統,深入了解之後你才能 Hack。
  6. Hack 自己 — 我發現早一點睡可以睡少一點,一天中的工作效率也比較高,所以開始 11pm 睡,5am 起床。
  7. 邀請別人來 Hack 你 — 迫使自己進步最好的方法,就是給對手看你的漏洞。當你知道他們很快就會找方法來 Hack 你,你非得把它補起來不可。
  8. 永無止境的追求效率 — 速度是效率的表現,所以你必須在每個環節都優化 — 回台灣之後,我試了至少 10 種開車上班的路徑,直到我試出最快速的一條。
  9. 對任何事情充滿關心、好奇 — 身為一個宅男,我會陪我老婆去逛街 — 事實上,她的很多衣服都是我挑的。我可以跟她時尚圈的同事朋友聊天,即使去她的高中、大學同學聚會我也玩得非常開心。
  10. 影響你身邊的人 — 你看,看完這篇文章你是不是也被我的 Hacker 精神感染了? So, Happy Hacking, Everyone!

The Why·Liam·Blog by WhyLiam is licensed under a Creative Commons BY-NC-ND 4.0 International License.

阅读全文 »
0%