Step-nya spt ini:
inventaris website berita spt: detik.com, kompas.com, washingtonpost.com, nytimes.com dst. (sebanyak mungkin) simpan list website ini database.
Selanjutnya open url site berita tsb, dan lakukan regular expression untuk identifikasi judul berita, content, sumber berita dst...