
Hadoop基本流程与应用开发
本文介绍了Hadoop的基本流程、业务场景、代码范例以及集成测试。本文是《分布式计算开源框架Hadoop入门实践》三部曲的最后一部。
Morph AppSpace是基于云计算的web应用托管平台,其最新版本已经开始支持Groovy和Grails。Morph Labs的CEO——David Abramowski,在百忙之中接受InfoQ采访,让我们了解到更多关于其进军Java领域的最新情况。
Terracotta和Sun Microsystem的VisualVM工具的集成,既可提供JVM又能实现集群范围内的可视化。上周Terracotta宣布其与Sun的VisualVM技术进行了集成,通过此举给Java开发人员和Web管理员赋于了可视化和分析能力,使其能借助Terracotta管理控制台执行Java应用程序的调优和故障诊断。
Jim Gray在过去40年中对技术发展有过巨大的贡献,“内存是新的硬盘,硬盘是新的磁带”是他的名言。“实时”Web应用不断涌现,达到海量规模的系统越来越多,这种后浪推前浪的发展模式对软硬件又有何影响?
多核处理器和松散耦合系统(如因特网)是多重处理器计算这一新趋势的两大推动力量,Peter Van Roy在2008国际计算机音乐会议(International Computer Music Conference 2008)上就此两种形式并行计算的相关问题题发表了看法,并提出了自己的解决方案。虽然这两种形式带来的挑战在本质上不尽相同,但是这些挑战都已经远在纯技术层面之上了。

本文介绍了Hadoop如何配置分布式框架运行环境,同时特别讲解了其中的一些细节。Hadoop可以单机跑,也可以配置集群跑,这里主要重点说一下集群配置运行的过程。本文是Hadoop入门实践三部曲的第二部。

Hadoop是Apache开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用,如亚马逊、Facebook和Yahoo等等。本文是Hadoop入门实践三部曲的第一部,主要讲述了What和Why的问题。

InfoQ的资深Java编辑Scott Delap采访了Hadoop的项目负责人Doug Cutting。Hadoop是一个开源的分布式计算平台,它主要由MapReduce的算法执行和一个分布式的文件系统等两部分组成。在这次InfoQ的专访中,Cutting论述了Hadoop是如何在Yahoo中被使用的,以及Hadoop发展中遇到的挑战和Hadoop项目未来的发展方向。