Bagaimana perbedaan waktu penyelesaian tugas memengaruhi makepan?

16

Mari kita mengatakan bahwa kita memiliki koleksi besar tugas τ1,τ2,...,τn dan koleksi identik (dalam hal kinerja) prosesor ρ1,ρ2,...,ρm yang beroperasi sepenuhnya secara paralel. Untuk skenario yang menarik, kita dapat mengasumsikan mn . Setiap τi membutuhkan sejumlah waktu / siklus untuk menyelesaikannya setelah ditugaskan ke prosesor ρj, dan setelah ditugaskan, itu tidak dapat ditugaskan kembali sampai selesai (prosesor selalu akhirnya menyelesaikan tugas yang ditugaskan). Mari kita asumsikan bahwa setiap τi mengambil sejumlah waktu / siklus Xi , tidak diketahui sebelumnya, diambil dari beberapa distribusi acak diskrit. Untuk pertanyaan ini, kita bahkan dapat mengasumsikan distribusi sederhana: P(Xi=1)=P(Xi=5)=1/2 , dan semua Xi independen berpasangan. Oleh karena itu μi=3 dan σ2=4 .

Misalkan, secara statis, pada waktu / siklus 0, semua tugas diberikan secara merata ke semua prosesor, seragam secara acak; jadi setiap prosesor ρj ditugaskan tugas (kita bisa juga mengasumsikan untuk keperluan pertanyaan). Kami menyebut makespan waktu / siklus di mana prosesor terakhir untuk menyelesaikan pekerjaan yang ditugaskan, menyelesaikan pekerjaan yang ditugaskan. Pertanyaan pertama:m | n ρ n/mm|nρ

Sebagai fungsi dari m , n , dan Xi 's, apa makespan M ? Secara khusus, apa itu E[M] ? Var[M] ?

Pertanyaan kedua:

Misalkan P(Xi=2)=P(Xi=4)=1/2 , dan semua Xi independen berpasangan, sehingga μi=3 dan σ2=1 . Sebagai fungsi dari m , n , dan ini baru Xi 's, apa makespan itu? Lebih menariknya, bagaimana perbandingannya dengan jawaban dari bagian pertama?

Beberapa eksperimen pemikiran sederhana menunjukkan jawaban untuk yang terakhir adalah bahwa makespan lebih panjang. Tetapi bagaimana ini bisa dikuantifikasi? Saya akan senang memposting contoh jika ini (a) kontroversial atau (b) tidak jelas. Bergantung pada keberhasilan dengan yang satu ini, saya akan memposting pertanyaan lanjutan tentang skema penugasan dinamis berdasarkan asumsi yang sama. Terima kasih sebelumnya!

Analisis kasus yang mudah: m=1

Jika , maka semua n tugas dijadwalkan ke prosesor yang sama. Makespan M hanya waktu untuk lengkap n tugas secara berurutan lengkap. Oleh karena itu, E [ M ]m=1nMn dan V a r [ M ]

E[M]=E[X1+X2+...+Xn]=E[X1]+E[X2]+...+E[Xn]=μ+μ+...+μ=nμ
Var[M]=Var[X1+X2+...+Xn]=Var[X1]+Var[X2]+...+Var[Xn]=σ2+σ2+...+σ2=nσ2

Sepertinya mungkin untuk menggunakan hasil ini untuk menjawab pertanyaan untuk ; kita hanya perlu menemukan ekspresi (atau perkiraan dekat) untuk max ( Y 1 , Y 2 , . . . , Y m ) di mana Y i = X i nm>1max(Y1,Y2,...,Ym) , variabel acak denganμY=nYi=Xinm+1+Xinm+2+...+Xinm+nmdanσ 2 Y =nμY=nmμX . Apakah ini menuju ke arah yang benar?σY2=nmσX2

Patrick87
sumber
Pertanyaan yang bagus Kalau saja tidak ada batas waktu hari ini ....
Dave Clarke

Jawaban:

8

Sebagai , kita dapat melihat ini dalam bentuk k dan n sebagai ganti n dan m . Katakanlah T i adalah waktu yang dibutuhkan prosesor ke - i untuk menyelesaikan pekerjaannya.m=k×nknnmTii

Ketika tumbuh, probabilitas bahwa T i = 5 k (prosesor hanya ditugaskan T = 5 tugas) untuk beberapa i mendekati 1 , sehingga makespan didefinisikan sebagai m a x ( T i ) , E [ M ] mendekati 5 k .nTi5kT=5i1max(Ti)E[M]5k

Untuk skenario kedua ini adalah sehingga meningkatkan jumlah prosesor membuat pemisahan 4–2 lebih baik.4k

Bagaimana dengan - meningkatkan jumlah tugas per prosesor? Meningkatkan k memiliki efek sebaliknya, membuatnya cenderung memiliki prosesor dengan serangkaian tugas yang kurang beruntung. Saya akan pulang sekarang tetapi saya akan kembali lagi nanti. "Firasat" saya adalah bahwa ketika k bertumbuh, perbedaan E [ M ] antara perpecahan 4-2 dan 5-1 menghilang, E [ M ] menjadi sama untuk keduanya. Jadi saya akan berasumsi bahwa 4-2 selalu lebih baik kecuali mungkin untuk beberapa kasus khusus (nilai spesifik sangat kecil darikkkE[M]E[M] dan n yang), jika bahkan itu.kn

Jadi untuk meringkas:

  • Varians yang lebih rendah lebih baik, semuanya sama.
  • Ketika jumlah prosesor bertambah, varians yang lebih rendah menjadi lebih penting.
  • Ketika jumlah tugas per prosesor bertambah, varians yang lebih rendah menjadi kurang penting.
svinja
sumber
+1 Intuisi luar biasa, dan ini membantu untuk memperjelas pemikiran saya juga. Jadi peningkatan jumlah prosesor cenderung meningkatkan makepan di bawah asumsi skala lemah; dan meningkatnya jumlah tugas cenderung mengurangi makepan di bawah asumsi skala yang kuat (tentu saja itu membutuhkan waktu lebih lama; maksud saya rasio kerja / makepan membaik). Ini adalah pengamatan yang menarik, dan tampaknya benar;
Patrick87
yang pertama dibenarkan oleh fakta bahwa cenderung 1 untuk k tetap dan meningkat n ; yang terakhir oleh fakta bahwa V a r [ X + X ] = V a r [ X ] + V a r [ X ] = 2 σ 24 σ 2 =1(1P(X=5)k)n1kn ... sehingga varians tidak meningkat secara linear sebagai fungsi dari k . Apakah itu sesuai dengan pemikiran Anda (itulah cara saya menafsirkan apa yang Anda miliki sejauh ini)? Var[X+X]=Var[X]+Var[X]=2σ24σ2=4Var[X]=Var[2X]k
Patrick87
Saya tidak tahu dari mana "firasat" itu berasal; itu tidak konsisten dengan alasan heuristik lainnya.
András Salamon
2

Saya menemukan bahwa argumen heuristik seringkali cukup menyesatkan ketika mempertimbangkan penjadwalan tugas (dan masalah yang berkaitan erat seperti pengepakan bin). Hal-hal dapat terjadi yang kontra-intuitif. Untuk kasus sederhana seperti itu, ada baiknya sebenarnya melakukan teori probabilitas.

Biarkan dengan k bilangan bulat positif. Misalkan T i j adalah waktu yang dibutuhkan untuk menyelesaikan tugas ke- j yang diberikan kepada prosesor i . Ini adalah variabel acak dengan mean μ dan varians σ 2 . Makespan yang diharapkan dalam kasus pertama adalah E [ M ] = E [ max { k Σ j = 1 T i j | i = 1 , 2 , ... ,n=kmkTijjiμσ2 Jumlahnya semua iid dengan rata-rata k μ dan varians k σ 2 , dengan asumsi bahwa T i j semua iid (ini lebih kuat daripada independensi berpasangan).

E[M]=E[max{j=1kTiji=1,2,,m}].
kμkσ2Tij

Sekarang untuk mendapatkan ekspektasi maksimum, kita perlu informasi lebih lanjut tentang distribusi, atau kita harus puas dengan batasan bebas distribusi, seperti:

yang dapat diterapkan jika jumlah prosesor-bijaksana adalah id. Ini tidak harus menjadi kasus jika waktu yang mendasari hanya berpasangan independen. Secara khusus, oleh Teorema 1, makespan yang diharapkan dibatasi di atas oleh Downey juga memberikan distribusi tertentu yang mencapai batas ini, meskipun distribusi berubah sepertin, dan tidak sepenuhnya alami.

E[M]kμ+σkn12n1.
n

σ2nk

X=maxi=1mXiY=maxi=1mYiXiYikixkμ

Pr[Xx]=i=1mPr[Xix]i=1mPr[Yix]=Pr[Yx].
Since most of the mass of the probability distribution of the maximum will be above its mean, E[X] will therefore tend to be larger than E[Y]. This is not a completely rigorous answer, but in short, the second case seems preferable.
András Salamon
sumber