본문 바로가기

Apache

Apache Solr 1. server launch (dedicated terminal) ###shell [jetulis@localhost example]$ sudo java -jar start.jar 2. indexing files : on a different terminal ###shell [cloudera@localhost exampledocs]$ sudo java -jar post.jar solr.xml monitor.xml 3. Tada ! search via admin screen ###shell http://localhost:8983/solr/select/?q=solr&start=0&rows=10&indent=on 4. index multiple files : posting ###shell [cloudera@l.. 더보기
[펌글]글로벌 IT기업들 '한국 빅데이터 시장을 잡아라' 좋은 글이 있어서 퍼왔다. 원본은 여기 글로벌 IT기업들 '한국 빅데이터 시장을 잡아라' 인수 합병 기반으로 빅데이터 솔루션 대거 출시 2011년 12월 25일 오후 13:00 김관용기자 kky1441@inews24.com [김관용기자] 글로벌 IT기업들이 국내 빅데이터 시장 공략을 가속화하고 있다. 방대한 정형 및 비정형 데이터 분석을 위해 진보된 컴퓨팅 기술과 이를 저장하고 분석하는 스토리지 기술을 앞세워 한국 시장 선점을 노리고 있는 것. 이들이 내세운 빅데이터 솔루션은 그동안 인수합병한 회사들의 솔루션을 고도화시킨 것으로 정형 및 비정형의 대용량 데이터를 활용·분석해 가치있는 정보를 추출하고, 이를 바탕으로 능동적인 대응과 변화 예측을 하는 것이 특징이다. 한국IBM 이상호 소프트웨어그룹 미들웨어.. 더보기
Hadoop 발췌원문 오픈소스인 하둡은 분산처리 시스템인 구글 파일 시스템(GFS)을 대체할 수 있는 하둡 분산 파일 시스템(HDFS)과 맵리듀스를 구현한 것이다. 맵리듀스는 쉽게 말하면 데이터를 분산시켜 처리한 뒤 하나로 합치는 기술이다. 물론 이와 유사한 기능을 제공했던게 바로 MPP다. 그러나 하둡은 MPP와 달리 사용이 편리했다. 개발자들이 각 데이터를 분산시키고 합치는 일을 할 필요없이 하둡의 맵리듀싱 기술이 이를 자동적으로 지원했다. 사용하기 쉽고 편리하다는 장점은 하둡이 급속도로 퍼지는 데 기여했다. 조금만 익히면 사용할 수 있었기 때문에 기업들은 하둡을 통해 PC를 병렬로 연결해 빅데이터를 분산 처리하는데 이용하기 시작했다. 기업은 사용자 분석을 쉽고 빨리 할 수 있으며, 사용자 지향의 새로운 서비스를.. 더보기