Pedoman Umum Data Terbuka

Panduan Penyusunan Data Terbuka Pemerintah DKI Jakarta

Kandidat Rekomendasi 28 November 2014

Editor:

Endiyan Rakhmanda, Open Data Lab Jakarta

Josef Hardi, Open Data Lab Jakarta

Prasetya Dwicahya, UKP4

Robertus Theodore, UKP4

Anggota:

Diah Setiawaty, Perludem

Ramda Yanurzha, World Bank

Sekar Ratnaningtyas, Transparency International Indonesia

Setiaji, Bappeda DKI Jakarta

                 

Kami mengucapkan terima kasih kepada para para kontributor antara lain Carlos Iglesias dari Web Foundation.


Abstrak

Dokumen ini berisikan petunjuk penyusunan data sesuai kaidah Data Terbuka bagi pemerintah kota DKI Jakarta. Aturan-aturan tertulis yang terdapat di dalam dokumen ini dimaksudkan sebagai pedoman umum bagi para penyedia data terbuka di lingkungan pemerintahan kota DKI Jakarta. Target pembaca dokumen ini adalah staf pengelolaan informasi dan data, staf pencatatan dan penyurvei data, staf penganalisis dan pelaporan data, dan staf entri data.


Status Dokumen

Dokumen Kandidat Rekomendasi ini bersifat tidak final dan akan diuji materinya oleh anggota-anggota yang tergabung dalam Kelompok Kerja Data Terbuka Jakarta.

Penyusunan dokumen ini didasarkan pada pemikiran awal penyediaan spesifikasi dan standardisasi Data Terbuka di DKI Jakarta. Keseluruhan isi materi akan disusun secara kolektif oleh anggota kelompok kerja dan kontributor publik. Dokumen ini akan ditinjau bersama, diperbaiki dan diumumkan kesiapannya oleh kelompok kerja untuk kemudian dapat digunakan secara bebas oleh komunitas pengguna. Untuk memberikan masukan dan komentar dapat disampaikan ke publik-pokja-data-jakarta@googlegroups.com.

Adapun pemanfaatan dokumen berstatus Kandidat Rekomendasi ini belum memiliki basis implementasi isi materi. Dokumen ini masih dapat diubah, dipindah atau digantikan oleh dokumen lain setiap saat. Oleh karena itu tidak dianjurkan untuk memberikan referensi atas dokumen ini sebagai produk siap pakai, selain dimaksudkan sebagai bahan penelusuran kemajuan pengerjaan atau materi pratayang

Dokumen ini disusun oleh Kelompok Kerja Data Terbuka Jakarta sebagai bagian dari gerakan Data Terbuka DKI Jakarta. Tujuan akhir pengerjaan dokumen ini adalah untuk menyusun panduan Data Terbuka bagi penyedia data di pemerintah kota DKI Jakarta pada khususnya dan pemerintah daerah lain pada umumnya.

Dokumen ini menggunakan lisensi terbuka Creative Commons by Attribution[1].


Daftar Isi

Abstrak

Status Dokumen

Daftar Isi

1. Pendahuluan

2. Definisi

3. Penyusunan Data

3.1 Nama Kolom Bersusun

3.2 Nilai Data Majemuk

3.3 Tabel dengan Kolom Terus Bertambah

3.4 Reproduksi Data Komputasi

4. Penulisan Data

4.1 Teks

4.2 Angka

4.3 Logika Biner

4.4 Tanggal & Waktu

4.5 Lokasi

4.6 Telepon

4.7 Email

4.8 URL

5. Penulisan Metadata

5.1 Nama Isian

5.2 Aturan Pengisian

6. Lisensi Data

6.1 Creative Commons by Attribution

6.2 Catatan dalam Pemberian Lisensi

Sejarah Revisi

1. Pendahuluan

Bagian ini bersifat informatif.

Dokumen panduan ini berisikan petunjuk tertulis penyusunan data sesuai kaidah Data Terbuka bagi pemerintah kota DKI Jakarta. Dokumen ini berlaku sebagai pedoman yang dapat dijadikan referensi pelaksanaan dalam mempersiapkan data pemerintah yang terbuka bagi masyarakat.

Dokumen panduan ini memiliki dokumen tambahan yang ditulis secara terpisah yang memuat detail teknis implementasi penyusunan data terbuka. Dokumen tambahan tersebut berisi pemaparan landasan teori dan spesifikasi internasional yang mendasari penyusunan petunjuk-petunjuk praktis di dalam dokumen panduan ini. Dokumen tambahan tersebut secara spesifik ditujukan bagi para pembaca yang bergerak di bidang perancangan sistem, pengembang perangkat lunak, pemerhati sistem informasi dan akademisi.

Dokumen panduan ini bersifat normatif dan informatif. Dari segi normatif, dokumen ini berisi standar pelaksaaan baku yang memberikan ketentuan pasti pelaksanaan kegiatan penyusunan data di lingkungan pemerintahan. Apabila dilaksanakan secara baik dan benar maka akan menghasilkan keluaran yang sesuai harapan dan bermaksud baik. Oleh karena itu setiap aturan-aturan tertulis dalam dokumen ini bersifat wajib dipenuhi. Dari segi informatif, dokumen ini menyajikan beberapa paparan berupa informasi dasar mengenai data terbuka. Informasi tersebut boleh disebarluaskan di lingkungan kerja guna memudahkan komunikasi antara aktor yang terlibat. Informasi yang diberikan dapat berisikan deskripsi panjang, catatan tambahan, tutorial, contoh pelaksanaan dan sebagainya yang menjelaskan isi standar dokumen panduan ini. Diharapkan dari penyajian kedua penekanan sifat ini para penggunanya dapat berpikir secara terarah, kritis dan kreatif dalam menyiapkan data yang hendak dibuka ke publik.

Akhir kata, dokumen ini ditujukan, dan tidak dibatasi, kepada staf pengelolaan informasi dan data, staf pencatatan dan penyurvei data, staf penganalisis dan pelaporan data, dan staf entri data.

2. Definisi

Bagian ini bersifat informatif.

Dokumen ini menggunakan beberapa istilah berkaitan dengan bidang Teknologi Informasi. Adapun definisi istilah-istilah telah terangkum dalam glosarium sebagai berikut:

Datum: Bentuk tunggal dari kata Data.

Data: Kumpulan nilai yang diberikan untuk mendeskripsikan suatu benda. Pengartian “benda” ini dapat berupa material fisik (cth. sekolah, puskesmas, jalan raya) atau konsep abstrak (cth. nilai inflasi, anggaran belanja, populasi penduduk). Istilah ini memiliki arti sama dengan istilah Data Statistik yang termuat dalam Peraturan Gubernur

Dataset: Kumpulan data yang disusun secara tematis oleh perorangan atau instansi.

Tabular: Bentuk terstruktur pengaturan data menggunakan konsep skema baris dan kolom. Rentang kolom merepresentasikan jenis pengukuran dan satuan baris merepresentasikan nilai-nilai pengukuran. Istilah tabular sering dipertukarkan bebas dengan istilah “tabel”.

Metadata:  informasi dari suatu data dalam format dan struktur yang distandarisasi untuk menggambarkan, menjelaskan, menempatkan atau memudahkan cara untuk mencari, menggunakan atau mengelola informasi dari data yang bersangkutan.

Distribusi Data: Wujud nyata penyebaran data. Bentuk-bentuk distribusi data terbuka antara lain: berkas CSV, kode API, atau acuan RSS.

Tipe Data: Bentuk pengklasifikasian nilai data yang menentukan keabsahan penulisan dan jenis operasi yang dapat diterapkan. Contoh tipe data antara lain: teks, angka, tanggal, waktu dan sebagainya.

3. Penyusunan Data

Data perlu disusun secara terstruktur untuk memudahkan analisis dan penggunaan kembali. Bentuk tabular umum dipakai dalam menyusun data secara terstruktur. Bentuk ini memiliki dua dimensi berupa kolom dan baris dimana rentang kolom merepresentasikan jenis pengukuran dan satuan baris merepresentasikan nilai data. Gambar di bawah ini memperlihatkan ilustrasi bentuk tabular.

 

Dalam pemanfaatan informasi digital perlu diperhatikan pula bahwa bentuk tabular bukanlah satu-satunya bentuk data yang dapat dipakai. Terdapat bentuk data lainnya seperti audio, video, foto, ilustrasi digital dan sebagainya.

Berikut adalah poin-poin penting mengenai penyusunan data tabular secara baik dan benar:

Nama-nama kolom umumnya disusun dalam satu baris dan ditempatkan pada baris pertama. Jika nama-nama tersebut tersusun dalam beberapa baris maka perlu diatur ulang agar terangkum dalam satu baris (lihat Sub-bab 3.1).

Ketidakjelasan tipe data dalam satu kolom dapat menyebabkan data sulit dianalisis secara otomatis. Oleh karena itu, data yang mengandung banyak informasi perlu dipisahkan dalam beberapa kolom, jika diperlukan. (lihat Sub-bab 3.2).

Setiap data baru yang dimasukkan harus membentuk baris baru, bukan kolom baru. Kolom baru hanya boleh ditambahkan apabila pengukuran baru diperkenalkan dalam metode pengumpulan. Jika ditemui bahwa memasukkan data baru berarti selalu memperkenalkan kolom baru maka skema data perlu diatur ulang (lihat Sub-bab 3.3).

Data harus disajikan dalam bentuk paling primer, atau data mentah. Hal ini dikarenakan data mentah dapat dipakai berulang dalam ragam analisis yang berbeda. Data hasil analisis hendaknya disajikan terpisah dari data mentah (lihat Sub-bab 3.4).

Berikut ini akan ditampilkan beberapa contoh kasus umum yang sekiranya dapat membantu pemahaman aturan praktis yang disebutkan di atas.

3.1 Nama Kolom Bersusun

Bagian ini bersifat informatif.

Sering kali ditemukan struktur tabular dengan nama-nama kolom tersusun secara hirarkis (lihat ilustrasi). Penyusuan nama kolom seperti ini akan sukar diproses oleh komputer.

 

Struktur tabular di atas dapat disusun ulang agar nama-nama kolom berada dalam satu baris:

unit

jenis_model

panjang

tebal

tinggi

Kotak 1

A

10

5

8

Kotak 1

B

12

5

10

Kotak 2

A

15

10

20

Kotak 2

B

15

10

30

Kotak 3

A

5

5

5

Kotak 3

B

10

10

10

3.2 Nilai Data Majemuk

Bagian ini bersifat informatif.

Pengisian nilai data dapat melibatkan lebih dari satu elemen informasi. Masing-masing elemen tersebut dapat memiliki tipe data yang berbeda (lihat ilustrasi). Penyajian data seperti demikian perlu diuraikan agar masing-masing elemen dapat dimengerti baik oleh komputer.

Tanggal

Biaya

Selasa, 2 September 2014

Rp 1.200.000,00

Rabu, 3 September 2014

US$ 100

Kamis, 11 September 2014

US$ 1,100

Jumat, 12 September 2014

Rp 3.450.000,00

Informasi tanggal dan biaya dalam struktur tabular di atas dapat diurai menjadi sebagai berikut:

tanggal

nilai_biaya

mata_uang

2014-09-02

1200000

IDR

2014-09-03

100

USD

2014-09-11

1100

USD

2014-09-12

3450000

IDR

Perhatikan bahwa nama hari tidak perlu diikutsertakan dalam penyajian informasi tanggal. Hal ini dikarenakan keterangan hari dapat dihasilkan ulang melalui fungsi analisis.

3.3 Tabel dengan Kolom Terus Bertambah

Bagian ini bersifat informatif.

Terkadang banyaknya jenis pengukuran data tidak dapat ditentukan secara pasti dari awal. Hal ini dapat menyebabkan penyusunan skema data yang tidak efisien. Salah satu contoh kasus nyata tersebut adalah bertambahnya jumlah kolom dari waktu ke waktu ketika data baru dimasukkan ke pencatatan (lihat ilustrasi).

Bulan

Meja

Kursi

Papan Tulis

Lemari

Januari

12

Februari

15

24

Maret

30

1

April

3

Tabel di atas memperlihatkan hasil pendataan peralatan secara berkala. Perhatikan bahwa di setiap pergantian bulan selalu terdapat penambahan kolom jenis peralatan yang ingin dicatat. Akibatnya struktur tabular ini dapat mengurangi efisiensi penyimpanan dan pengolahan data. Struktur di atas dapat diperbaiki dengan mengubahnya sebagai berikut:

bulan

jenis_peralatan

jumlah

Januari

Meja

12

Februari

Meja

15

Februari

Kursi

24

Maret

Kursi

30

Maret

Papan Tulis

1

April

Lemari

3

Kasus ini lazim ditemui dalam proses pencatatan data terkait dengan proses memasukkan data observasi atau survei lapangan.

3.4 Reproduksi Data Komputasi

Bagian ini bersifat informatif.

Menyatukan data primer (atau data mentah) dengan data hasil komputasi pada dasarnya tidak direkomendasikan. Hal ini untuk mencegah penyisipan data tidak valid yang dapat dimungkinkan akibat kesalahan teknis perhitungan.

Solusi yang direkomendasikan adalah dengan membuat dua salinan data. Salinan pertama berisikan data primer saja dan salinan kedua berisikan juga nilai-nilai hasil komputasi. Rumus analisis untuk mereproduksi hasil komputasi perlu disertakan dalam deskripsi data agar dapat divalidasi.

Unit

Panjang

Tebal

Tinggi

Volume

Kotak 1

10

5

8

400

Kotak 2

15

10

20

3000

Kotak 3

5

5

5

150

Tabel di atas memiliki kolom Volume yang didapat dari perkalian tiga kolom sebelumnya (yi. Panjang, Tebal dan Tinggi). Perhatikan bahwa kesalahan teknis perhitungan mungkin dapat terjadi dan hal ini dapat menyebabkan validitas keseluruhan data menjadi diragukan (cth. terdapat kesalahan dalam perhitungan volume Kotak 3).

unit

panjang

tebal

tinggi

Kotak 1

10

5

8

Kotak 2

15

10

20

Kotak 3

5

5

5

Dengan menyajikan salinan data yang berisikan data primer saja, penggunaan data yang tidak valid dapat dihindari.

4. Penulisan Data

Bagian ini berisikan pedoman penulisan data secara baku menurut masing-masing tipe data. Penentuan format baku penulisan data sangat penting untuk meningkatkan interoperabilitas data dan keseragaman. Dokumen ini membagi tipe data ke dalam 8 kategori dasar, antara lain:

Berikut ini akan dibahas secara detail satu per satu tipe data.

4.1 Teks

Penulisan tipe data Teks memiliki kebebasan penggunaan semua karakter tulisan.

Contoh penulisan benar:

Jakarta Pusat

SND129:21/2014

Rp 20.000,00

Daerah Khusus Ibukota Jakarta (DKI Jakarta, Jakarta Raya) adalah ibu kota negara Indonesia.

Sebagai catatan, ada beberapa teks yang format penulisannya akan dibakukan untuk keseragaman, antara lain penulisan alamat bangunan, nomor telepon, alamat email dan URL situs.

4.2 Angka

Penulisan tipe data Angka terbatas pada karakter numerik [0...9][2], karakter penanda positif atau negatif, dan karakter pemisah desimal.

Karakter penanda positif menggunakan tanda plus (`+`) dan penanda negatif menggunakan tanda minus (`-`). Tergantung dari konfigurasi lokalisasi di sistem operasi komputer, karakter pemisah desimal dapat berupa tanda titik (`.`) atau tanda koma (`,`). Dokumen ini merekomendasikan penggunaan tanda titik untuk meningkatkan interoperabilitas penggunaan data angka tersebut.

Contoh penulisan benar:

125

100000

-100000

123.45

0.000012345

Dalam menuliskan tipe data Angka, karakter-karakter khusus seperti penanda finansial atau persentase harus dihindari. Penggunaan karakter-karakter tambahan ini akan menyebabkan tipe data berubah menjadi tipe data teks. Akibatnya fungsi analisis data dapat mustahil diaplikasikan.

Contoh penulisan salah:

10.000.000

Rp10.000.000,00

2.5%

4.3 Logika Biner

Penulisan tipe data Logika Biner terbatas pada karakter satu (`1`) dan nol (`0`) yang merepresentasikan dua kondisi: benar atau salah. Alternatif lain menuliskan tipe data ini adalah dengan menggunakan istilah: ya” dan “tidak”. 

Simbol

Arti

1

benar

0

salah

ya

benar

tidak

salah

4.4 Tanggal & Waktu

Penulisan tipe data Tanggal & Waktu berdasarkan kalender Gregorian yang menghitung perubahan waktu menurut gerakan perputaran bumi terhadap matahari. Tipe data ini terbagi menjadi 5 sub-tipe sesuai detail kebutuhan, antara lain:

Tanggal

Penulisan tipe data Hari terbatas pada karakter 2-angka [01...31] yang dapat diartikan sebagai urutan angka tanggal ‘01’, ‘02’, ‘03’, …, ‘29’, ‘30’ ,’31’.

Contoh penulisan benar:

04

22

Contoh penulisan salah:

022

32

Bulan

Penulisan tipe data Bulan terbatas pada karakter 2-angka [01...12] yang dapat diartikan sebagai pemetaan nama-nama bulan:

Contoh penulisan benar:

02

10

Untuk menghindari permasalahan penggunaan ragam bahasa dan penerjemahannya, dokumen ini tidak merekomendasikan penggunaan label penamaan bulan. Oleh karenanya penulisan nama bulan seperti “Januari”, “Februari”, “Maret”, dan variasinya harus dihindari.

Contoh penulisan salah:

Februari

Feb

13

Tahun

Penulisan tipe data Tahun terbatas pada karakter 4-angka [0000...9999].

Tanda minus (`-`) dapat digunakan sebagai penanda tahun sebelum era umum (SM - Tahun Sebelum Masehi). Penulisan angka tahun yang dipersingkat tidak diperbolehkan.

Contoh penulisan benar:

-0001

0354

1999

Catatan: Contoh pertama merujuk tahun 1 SM

Contoh penulisan salah:

354

‘99

Tanggal Kalender

Penulisan tipe data Tanggal Kalender menggunakan komponen-komponen karakter dari penulisan informasi Tanggal, Bulan dan Tahun. Secara spesifik penulisan baku tipe data Tanggal mengikuti format sebagai berikut:

[Tahun]-[Bulan]-[Tanggal]

atau

[Tahun]-[Bulan]

Perhatikan karakter tanda pisah (`-`) dipakai untuk memisahkan tahun, bulan dan tanggal.

Contoh penulisan benar:

2014-01-01

1999-12-31

1999-12

Contoh penulisan salah:

2014-1-1

01-01-2014

31 Desember 1999

Waktu

Penulisan tipe data Waktu mengikuti aturan sistem waktu 24-jam. Komponen-komponen penulisannya terdiri dari penunjuk jam, menit dan detik. Khusus penunjuk detik, pencantuman informasi ini bersifat opsional. Secara spesifik penulisan baku tipe data Jam mengikuti format sebagai berikut:

[jam]:[menit]:[detik]

atau

[jam]:[menit]

Perhatikan karakter tanda titik-dua (`:`) dipakai untuk memisahkan jam, menit dan detik.

Dokumen ini merekomendasikan penulisan waktu yang disertai keterangan zona waktu di Indonesia. Keterangan zona waktu disesuaikan dengan aturan Coordinated Universal Time (UTC) yang membagi 3 zona waktu di Indonesia, antara lain:

[jam]:[menit]:[detik]+0700

[jam]:[menit]:[detik]+0800

 [jam]:[menit]:[detik]+0900

Apabila keterangan zona waktu tidak diberikan maka terdapat potensi penulisan informasi waktu yang ambigu. Kesepakatan umum yang sering dijadikan alternatif adalah penerimaan konteks waktu sesuai asal wilayah cakupan data.

Contoh penulisan benar:

09:15:10+0700

10:15:10+0800

11:15:10+0900

19:15:10

19:15

Contoh penulisan salah:

09.15.10

09.15

9:15

09:15 WIB

4.5 Lokasi

Tipe data Lokasi terbagi menjadi 3 sub-tipe antara lain:

Garis Lintang

Penulisan tipe data Garis Lintang terbatas pada penggunaan derajat bumi +90 sampai -90. Dokumen ini merekomendasikan tingkat ketelitian minimum 4-angka di belakang koma. Penulisannya menggunakan format angka desimal.

Contoh penulisan benar:

30.0000

-15.6821828

Garis bujur

Penulisan tipe data Garis Lintang terbatas pada penggunaan derajat bumi +180 sampai -180. Dokumen ini merekomendasikan tingkat ketelitian minimum 4-angka di belakang koma. Penulisannya menggunakan format angka desimal.

Contoh penulisan benar:

110.0000

-62.6821828

Alamat

Penyusunan nama alamat memerlukan 5 komponen wajib penunjuk lokasi antara lain:

Adapun komponen lain yang bersifat opsional antara lain:

Secara umum penulisan baku tipe data Alamat mengikuti format sebagai berikut:

[nama kompleks], [nama jalan] No. [nomor], [kelurahan / desa], [kecamatan], [kota] [kode pos]

Kata “Nomor” atau akronim “No.” dipakai untuk memisahkan antara nama jalan dan nomor bangunan. Perhatikan bahwa tanpa kehadiran kata atau akronim pemisah tersebut, penulisan angka selanjutnya akan diasumsikan sebagai bagian dari nama jalan ketimbang nomor bangunan. Karakter spasi tunggal dipakai untuk memisahkan nama kota dan kode pos.

Contoh penulisan benar:

Jl. Pati No. 1, Menteng, Jakarta Pusat 10310

Kompleks Giri Indah, Jl. Dukuh 3 No. 3, Cibodas, Tangerang 15138 

Jl. Dukuh 3 No. 3 RT02/RW11, Cibodas, Tangerang 15114, Banten

Catatan: Contoh ketiga bersifat pilihan karena keterangan RT, RW dan provinsi tidak mutlak dicantumkan.

Contoh penulisan salah:

Jl. Pati No. 1, Menteng

Jl. Dukuh 3, Cibodas, Tangerang 15138 

Catatan:

- Contoh pertama salah karena tidak mencantumkan nama kota dan kode pos.

- Contoh kedua salah karena tidak ada nomor rumah. Perhatikan bahwa “Jl. Dukuh 3” tidak sama dengan “Jl. Dukuh No. 3”.

4.6 Telepon

Penyusunan nomor telepon memerlukan 2 komponen wajib antara lain:

Adapun komponen lain yang bersifat optional antara lain:

Secara spesifik penulisan baku tipe data Telepon mengikuti format sebagai berikut:

[kode area] [nomor sambungan]


[kode operator] [nomor sambungan]

Dokumen ini memberikan kebebasan penggunaan variasi format penulisan nomor telepon asalkan untuk selalu konsisten di setiap penulisan datanya.

Contoh penulisan benar:

021 123456789

0815 123456789

(021) 123456789

0815-1234-56789

0039 21 123456789

+39 815 123456789

Catatan: Dua contoh terakhir menampilkan penulisan tipe data Telepon menggunakan kode negara. Perhatikan variasi penulisan kode negara dapat berupa ‘00[kode negara]’ dan ‘+[kode negara]’

4.7 Email

Penyusunan alamat email memerlukan 2 komponen wajib antara lain:

Secara spesifik penulisan baku tipe data Email mengikuti format sebagai berikut:

[nama lokal]@[nama domain]

Karakter ampersat (`@`) dipakai untuk memisahkan nama lokal dan nama domain.

Contoh penulisan benar:

namalokal@example.com

nama.lokal@example.com

Contoh penulisan salah:

namalokalsaja

nama.lokall.example.com

nama.lokal(at)example.com

nama(dot)lokal(at)example(dot)com

4.8 URL

Penyusunan alamat situs URL memerlukan 3 komponen sebagai berikut:

Protokol yang umum dipakai untuk alamat situs adalah HTTP dan HTTPS. Secara spesifik penulisan baku tipe data URL mengikuti format sebagai berikut:

http://[nama host]/[penunjuk lokasi]

https://[nama host]/[penunjuk lokasi]

Contoh penulisan benar:

http://example.com

https://example.com/data/01/2013/dataset.csv

Contoh penulisan salah:

example.com

/example.com/data/01/2013/dataset.csv

Rangkuman Tipe Data

Tabel di bawah ini menampilkan rangkuman contoh-contoh penulisan data secara baku sesuai dengan tipe datanya masing-masing.

Tipe Data

Contoh Penulisan Baku

Teks

Jakarta Pusat

“SND129:21/2014”

“Rp 20.000,00”

Daerah Khusus Ibukota Jakarta (DKI Jakarta, Jakarta Raya) adalah ibu kota negara Indonesia.”

Angka

“125”

“100000”

“-100000”

“123.45”

“0.000012345”

Logika Binari

“1”

“0”

“ya”

“tidak”

Tanggal

“04”

“22”

Bulan

“02”

“10”

Tahun

“-0001”

“0354”

“1999”

Tanggal Kalender

“2014-01-01”

“1999-12-31”

Waktu

“09:15:10+0700”

“10:15:10+0800”

“11:15:10+0900”

“19:15:10”

“19:15”

Garis Lintang

“30.0000”

“-15.6821828”

Garis Bujur

“110.0000”

“-62.6821828”

Alamat

Jl. Pati No. 1, Menteng, Jakarta Pusat 10310”

“Kompleks Giri Indah, Jl. Dukuh 3 No. 3, Cibodas, Tangerang 15138”

Telepon

“021 123456789”

“0815 123456789”

“(021) 123456789”

“0815-1234-56789”

“+39 21 123456789”

Email

namaemail@example.com”

nama.email@example.com”

URL

“http://example.com”

https://example.com/data/01/2013/dataset.csv”

5. Penulisan Metadata

Bagian ini berisikan pedoman penulisan metadata untuk mendeskripsikan dataset dan tabel data secara tepat dan benar.

5.1 Nama Isian

Berikut ini diberikan daftar nama isian tentang informasi metadata. Kecuali disebutkan keterangan “opsional”, semua nama isian di bawah adalah bersifat wajib diisi oleh penyedia data.

Deskripsi

Isi mudah dimengerti dan menjelaskan hal dan catatan penting dalam data set.

Tag

Kata Kunci untuk memudahkan pencari kumpulan data.

Sumber

Organisasi/institusi yang menerbitkan kumpulan data.

Kontak

Alamat email atau nomor telepon dari sumber yang bertanggung jawab terhadap kumpulan data ini. Kontak harus bisa melayani pertanyaan yang berkaitan dengan kumpulan data ini.

Visibility

Keterangan yang bisa melihat kumpulan data.

Frekuensi Penerbitan

Frekuensi penerbitan kumpulan datanya, apakah mingguan, bulanan dan sebagainya.

Level Penyajian

Keterangan granularitas atau sebarapa detil data tersebut disajikan.

Tahun

Interval waktu atau tahun atau bulan atau periode yang mendeskripsi kondisi di mana kumpulan data ini relevan.

Cakupan

Wilayah spasial di mana data tersebut diambil atau berlaku.

Format

Format dari data.

Lisensi

Lisensi yang digunakan oleh kumpulan data.

Versi

(Opsional) Versi dari kumpulan data.

Rujukan

(Opsional) Keterangan tambahan yang tersedia di situs lain, yang mungkin bisa menambah informasi mengenai kumpulan data tersebut.

Pengaturan lebih terperinci mengenai implementasi metadata ini dapat ditemukan di dokumen Pedoman Pendamping Pemublikasian Data Terbuka.

5.2 Aturan Pengisian

Pengisian informasi metadata bertujuan untuk memberikan ringkasan perihal data yang dibuka untuk publik. Informasi ini akan banyak dipakai untuk keperluan penyusunan katalog data dan pencarian data menggunakan kata kunci. Oleh karena itu, penulisan informasi metadata harus memperhatikan kejelasan dan keakuratan isi berita selain diutamakan penyajiannya yang singkat dan sederhana. Berikut adalah beberapa petunjuk praktis pengisian nama-nama isian metadata:

        Beberapa kata kunci yang dapat dijadikan tema antara lain:

  1. topik utama data (cth. anggaran belanja, nilai produksi, volume ekspor, tingkat kriminalitas),
  2. obyek utama data (cth. puskesmas, sekolah dasar, universitas negeri, jalan raya, penduduk),
  3. lokasi asal data (cth. Indonesia, DKI Jakarta, Jakarta Barat, Teluk Jakarta),
  4. tingkat penyajian data (cth. laporan rekapitulasi, daftar penyusunan).

Hindari penggunaan detail periode waktu pada penulisan nama dataset. Informasi ini dapat dialihkan ke tingkat penamaan pendistribusian data. Hindari juga penggunaan kata atau frase yang dirasa tidak penting, seperti “Dataset Mengenai ...”, “Data Tentang …”, “Laporan ...”, dan sebagainya.

Contoh penulisan nama dataset yang baik:

Rekapitulasi Anggaran Pendapatan dan Belanja Daerah DKI Jakarta

Daftar Sekolah Menengah Atas Negeri Jakarta Selatan

Daftar Kasus Kriminalitas Pencurian Jakarta Pusat

Tingkat Polusi Udara Gas Berbahaya DKI Jakarta

Gunakan 2-3 paragraf untuk memaparkan secara jelas dan akurat kumpulan data-data yang terdapat dalam dataset. Cantumkan penjelasan singkat mengenai nama-nama kolom yang digunakan dalam tabel data untuk memudahkan pembacaan data oleh penggunanya. Perhatikan bahwa isi deskripsi tidak seharusnya menjelaskan satu-per-satu tabel data. Hal ini berkaitan dengan penggunaan skema tabel yang sama di satu dataset.

Jumlah maksimal yang dianjurkan adalah 4 buah. Gunakan acuan ini sebagai indikator penyusunan tema dataset. Jika jumlahnya terlalu berlebihan maka ada kemungkinan dataset tersebut memiliki banyak tema dan perlu diperinci. Pastikan isian tag memiliki kata-kata kunci yang terdapat di dalam nama dataset.

Dianjurkan untuk memberikan alamat email dari institusi yang bertanggung jawab atas dataset dari halaman “Kontak Kami” di situs resmi penyedia data.

Pengisian keterangan tahun memberikan informasi waktu kesegaran data yang dipublikasikan. Isian ini penting untuk menunjukkan relevansi informasi yang terkandung dengan waktu penggunaan.

Contoh penulisan lingkup periode tahun pembuatan:

2010

2010 - 2013

Januari 2013 - April 2013

Konvensi sederhana, apabila nama bulan dicantumkan dalam isian tahun maka dapat dipastikan data memiliki frekuensi penerbitan secara bulanan (mis. per 1-bulan, 3-bulan, 6-bulan). Apabila hanya angka tahun dicantumkan maka dapat dipastikan data disusun secara tahunan.

Data seharusnya disusun menurut periode waktu tertentu. Oleh karenanya detail waktu ini perlu disertakan dalam penulisan nama data guna mempermudah pencarian.

Contoh penulisan nama dataset (cetak tebal) dan nama sumber daya:

Rekapitulasi Anggaran Pendapatan dan Belanja Daerah DKI Jakarta

APBD 2010

APDB 2011

APDB 2012

APDB 2013

Daftar Kasus Kriminalitas Pencurian Jakarta Pusat

Daftar Kasus Januari 2013

Daftar Kasus Februari 2013

Daftar Kasus Maret 2013

Daftar Kasus April 2013

Untuk memudahkan pemilihan nama berkas distribusi data, penulisannya dapat mengikuti nama sumber daya, diikuti ekstensi format data yang dipakai. Contoh penulisan nama dataset (cetak tebal), nama data (kolom pertama) dan nama sumber daya (kolom kedua):

Rekapitulasi Anggaran Pendapatan dan Belanja Daerah DKI Jakarta

APBD 2010

apbd-2010.csv

apbd-2010.xlsx

APDB 2011

apbd-2011.csv

apbd-2010.xlsx

APDB 2012

apbd-2012.csv

apbd-2012.xlsx

APDB 2013

apbd-2013.csv

apbd-2013.xlsx

Daftar Kasus Kriminalitas Pencurian Jakarta Pusat

Daftar Kasus Januari 2013

daftar-kasus-pencurian-januari-2013.csv

Daftar Kasus Februari 2013

daftar-kasus-pencurian-februari-2013.csv

Daftar Kasus Maret 2013

daftar-kasus-pencurian-maret-2013.csv

Daftar Kasus April 2013

daftar-kasus-pencurian-april-2013.csv

6. Lisensi Data

6.1 Creative Commons by Attribution

Bagian ini bersifat informatif.

Tujuan utama dari Data Terbuka adalah memaksimalkan penggunaan data seluas-luasnya untuk menciptakan suatu nilai tambah. Untuk mencapai hal tersebut, Data Terbuka memberikan dua komponen dari keterbukaan, yaitu: terbuka secara teknis dan terbuka secara legal.

Pada bagian sebelumnya, telah dibahas berbagai cara untuk membuat data terbuka secara teknis. Oleh karena itu, bagian ini akan melengkapi pembahasan dari Data Terbuka yaitu dengan memberikan informasi dan panduan apa yang dimaksud dengan terbuka secara legal dan cara-caranya yang dibutuhkan untuk mencapai itu.

Secara sederhana, yang dimaksud dengan data yang terbuka secara legal adalah tidak ada halangan dari sisi aturan atau hukum untuk menggunakan data tersebut. Data boleh dan dapat digunakan oleh siapa saja, untuk tujuan apa saja, kapan saja, tanpa prasyarat apapun, kecuali dengan memberikan atribusi kepada pemilik data. Oleh karena itu, dibutuhkan suatu mekanisme yang jelas untuk mencapai hal-hal tersebut. Salah satu pilihan mekanisme yang bisa digunakan adalah pemberian lisensi kepada data yang hendak dijadikan terbuka secara legal.  

Pembubuhan lisensi atas data diartikan sebagai pemberian hak menggunakan data untuk kepentingan tertentu sesuai dengan syarat dan ketentuan yang tertera di dalam lisensi tersebut tanpa meniadakan hak cipta atas data tersebut. Dengan pemberian lisensi kepada data, data dapat dipergunakan secara mudah (dengan syarat dan ketentuan tertentu) tanpa harus meminta izin melalui mekanisme hak cipta.

Lisensi Creative Commons adalah salah satu lisensi publik yang memungkinkan pemilik karya untuk mendistribusikan dan memperbolehkan penggunaan karyanya secara bebas. Ada beberapa tipe lisensi Creative Commons yang dapat dipergunakan ketika seorang pemilik karya hak cipta hendak mendistribusikan dan memperbolehkan penggunaan atas karyanya.

Tipe-tipe lisensi Creative Commons antara lain:

Simbol

Hak

Deskripsi

Attribution

Attribution

(BY)

Mengizinkan orang lain untuk menyalin, mendistribusikan, menampilkan, serta membuat karya turunan berdasarkan suatu karya hanya jika orang tersebut memberikan penghargaan pada pencipta atau pemberi lisensi dengan cara yang disebutkan dalam lisensi.

Share-alike

ShareAlike

(SA)

Mengizinkan orang lain untuk mendistribusikan suatu karya turunan hanya di bawah suatu lisensi yang identik dengan lisensi yang diberikan pada karya aslinya.

Non-commercial

Non-Commercial

(NC)

Mengizinkan orang lain menyalin, mendistribusikan, menampilkan, serta membuat karya turunan berdasarkan suatu karya hanya untuk tujuan non-komersial.

Non-derivative

Non-Derivative

(ND)

Mengizinkan orang lain menyalin, mendistribusikan, dan menampilkan hanya salinan sama persis (verbatim) suatu karya, bukan karya turunan yang berdasarkan karya tersebut.

Dari tipe-tipe lisensi di atas, maka lisensi Creative Commons yang paling tepat untuk digunakan untuk Data Terbuka di Indonesia adalah lisensi Creative Commons by Attribution (CC-BY) dikarenakan lisensi CC-BY inilah yang paling mendekati persyaratan keterbukaan dari Data Terbuka, yaitu: pengguna dapat mendistribusikan data dan menggunakan data secara bebas baik untuk kepentingan komersil, maupun non-komersil tanpa syarat kecuali dengan memberikan atribusi kepada pemilik data.

Selain itu, lisensi CC-BY ini bisa dikatakan sebagai lisensi publik paling mudah dipakai untuk memaksimalkan penggunaan atas data tanpa membuat pengguna data khawatir atas status legalitas dari penggunaan data dan akibat dari penggunaan data tersebut.

Lisensi Creative Commons juga terus berkembang dan menyesuaikan syarat dan ketentuan yang ada di dalam lisensi sesuai dengan perkembangan zaman dan pembelajaran dari penggunaan lisensi Creative Commons versi-versi terdahulu. Untuk saat ini, lisensi Creative Commons sudah mencapai versi 4.0[3].

6.2 Catatan dalam Pemberian Lisensi

Pada dasarnya, sangatlah mudah bagi suatu organisasi untuk memberikan lisensi CC-BY kepada dataset yang hendak dirilis. Ada poin-poin penting yang harus diperhatikan ketika melakukan pemberian lisensi, yaitu:

  1. Pastikan bahwa pemahaman atas lisensi CC-BY sudah betul dan paham akan segala konsekuensi legal atas diberikan lisensi CC-BY kepada suatu dataset.
  2. Komunikasikan tentang CC-BY ini kepada seluruh anggota tim di dalam organisasi yang terlibat dengan kegiatan Data Terbuka agar semua anggota tim mendapatkan pemahaman yang sama mengenai lisensi CC-BY.
  3. Pemilik dataset atau unit yang diberikan kuasa atas dataset oleh pemilik dataset memberikan lisensi CC-BY kepada dataset yang hendak dirilis dengan mencantumkan lisensi CC-BY di dalam metadata dataset tersebut.
  4. Perlu diperhatikan bahwa hanya pemilik dataset atau unit yang diberikan kuasa atas dataset yang dapat memberikan lisensi. Hal ini dikarenakan pemilik dataset atau unit yang diberikan kuasa atas dataset yang memiliki hak cipta atas dataset. Pemberian lisensi hanya bisa dilakukan oleh pihak yang memiliki hak cipta atas dataset. OIeh karena itu diperlukan klarifikasi terlebih dahulu atas kepemilikan dari dataset tersebut untuk memudahkan proses pemberian lisensi CC-BY kepada dataset.
  5. Pemberian lisensi (dalam konteks ini adalah lisensi CC-BY) hanya diberikan kepada dataset yang dikategorikan sebagai Informasi Publik berdasarkan Undang-Undang No. 14 Tahun 2008 tentang Keterbukaan Informasi Publik[4]. Oleh karena itu diperlukan suatu proses terstandardisasi di dalam organisasi untuk menentukan apakah suatu dataset dimasukkan ke dalam kategori Informasi Publik atau bukan.

Sejarah Revisi

28 November 2014

25 November 2014

21 November 2014

3 November 2014

20 Oktober 2014

1 Oktober 2014


[1] Detail lisensi dapat dilihat di alamat http://creativecommons.org/licenses/by/4.0/

[2] Penyajian [0...9] dibaca sebagai rentang nilai dari angka 0 sampai angka 9, yi. 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.

[3] Tautan dokumen: https://creativecommons.org/version4

[4] Tautan dokumen: http://www.komisiinformasi.go.id/regulasi/view/uu-nomor-14-tahun-2008-3