Friday, December 4, 2009

Download Jawapos ePaper Menggunakan Bash (lagi)


Selanjutnya setelah kemarin posting script untuk download ePaper-nya Kompas, iseng-iseng Saya oprek lagi beberapa situs penyedia ePaper lainnya. Kali ini Saya mencoba oprek di ePapernya Jawapos.

Halaman awal ePaper Jawapos terlihat sangat sederhana, hanya menampilkan image dari halaman ePaper dan paging  untuk tiap halaman. Ternyata logika untuk mendownload ePaper Jawapos sangat berbeda dengan ePaper milik Kompas. Setelah sedikit menyelidiki situs Jawapos, akhirnya ketahuan bahwa Jawapos menggunakan link-link yang sudah fix untuk menampilkan halaman ePaper.. Selanjutnya adalah mengambil link-link tersebut untuk diproses di Bash.

Ini script dari jawapos.sh

#!/bin/bash# Jawapos ePaper Downloader
# Created by Sugeng Doyle

# URL Jawapos
URL=”http://versipdf.jawapos.co.id/index.php?detail=”

# Fix Link untuk direct PDF file ePaper
PAGE=(00241260 00361260 00481260 00601260 00721260 00841260 00961260 01081260 01201260 001200241260 002400241260 003600241260 004800241260 006000241260 007200241260 008400241260)

# Jawapos membagi kategori link berdasarkan jp, or, mt
PAGEDL=(“jp” “or” “mt”)

# Tanggal Hari ini
TGL=`date +%d-%b-%Y`

# Rename mulai dari 1
FILENAME=1

# Buat Folder sesuai tanggal
mkdir -p $TGL

# Looping kategori linknya
for i in ${PAGEDL[@]}; do
URL_DL=$URL$i

# Looping halaman
for j in ${PAGE[@]}; do

if [ ${#FILENAME} == 1 ]; then
FILE=”00″$FILENAME
else if [ ${#FILENAME} == 2 ]; then
FILE=”0″$FILENAME
else FILE=$FILENAME
fi
fi

# Check apakah link tersebut aktif
CHECK=`wget -nv –spider $URL_DL”_det&file_det=”$j`

if [ ${#CHECK} == 0 ]; then
# Download file pdf ePaper
wget -nv -O $TGL/$FILE.pdf $URL_DL”_det&file_det=”$j
let FILENAME+=1
fi
done
done
exit

Download script jawapos.zip

Sama seperti Kompas ePaper Downloader, jalankan script ini dengan perintah ./jawapos.sh kemudian akan dibuat folder sesuai dengan tanggal per-download. ePaper Jawapos berformat PDF yang terpisah pisah. Untuk menggabungkan file-file pdf yang sudah di download bisa menggunakan pdftk.

sudo apt-get install pdftk

Untuk menggabungkannya gunakan perintah

pdftk *.pdf cat output JawaPos.pdf

Dalam console berada di folder PDF-nya.

Selamat mencoba. Ngoprek-ngoprek lagi ah…

13 Tanggapan ke “Download Jawapos ePaper Menggunakan Bash (lagi)”

  1. koka Says:

    wah bingung bos….yg instan langsung ada ga..buat pemula

  2. Merary7 Says:

    kalo pikiran rakyat bisa ga mas sugeng?? thx

No comments:

Post a Comment