[筆記] 如何正確實作 JavaScript Array Random Shuffle 亂數排序演算法

March 14, 2019

分類標籤：javascript

Array random shuffle 是一個很常使用的演算法，但你真的知道如何正確地實作它嗎？這篇文章將會討論各種用 JavaScript 實作 array random shuffle (亂數排序) 的方法，以及他們的優缺點。

`sort()`

先前情提要一下 JavaScript 內建的 sort() 函數。

Array.prototype.sort() 接受一個「比較函數」作為參數，這個函式的用途是讓 JavaScript engine 知道 array裡面的物件的大小關係，如此一來 JavaScript engine才能夠排序。

這個「比較函式」的輸入參數 (a, b) 是 array 裡的任兩個要比較的項目，回傳值是一個數字，負數表示a比b小，正數表示a比b大，相等表示一樣大。

總之，如果我們想要排序一個「數字」的 array，最簡潔的寫法如下：

array.sort((a, b) => (a - b));

神奇的 JavaScript 亂數排序演算法

網路上看到 JavaScript 有一種很簡潔的寫法，可以將一個array作亂數排序 (random shuffle)：

function sort(array) {
  array.sort(() => Math.random() - 0.5);
}

太簡潔了吧！但是原理到底是什麼？

就讓我們一起來看一下這段 code 有什麼作用吧！

首先，Math.random() 會回傳一個介於0 ~ 1的數字，

那麼，Math.random() - 0.5 自然就會回傳一個介於-0.5 ~ +0.5的數字。

如果排序時，給定任兩個數字(a, b)，隨機回傳一個介於-0.5 ~ +0.5的數值，表示任兩個數字之間的大小相對關係是隨機的。

所以排序完的結果也是隨機的。

個人覺得是非常有趣 (?) 的思路，代碼行數又短，乍看是個滿優雅的寫法。

不過繼續往下看，會發現一件有趣的事情：

機率分佈不等

用瀏覽器跑隨機洗牌一萬次，紀錄可能結果的數量，得到以下結果：

同樣的程式碼，用node (v8.10.0)測試，得到以下結果：

123: 2497862
132: 1249208
213: 2499671
231: 1250147
312: 1252508
321: 1250604

可以看到不管是node或是瀏覽器環境，使用這種亂數排序演算法，各種結果出現的機率並不是均等的。

為什麼會這樣呢？

Shuffle an Array 的解釋是，JavaScript的sort是個黑盒子，我們不知道引擎內部排序的機制，不同的引擎實作出來的sort也會有差異。

我沒有特別深入了解引擎內部的機制，不過結果機率分布不均的現象的確存在，因此這似乎不是一個可以在認真的場合使用的實作。

那有沒有比較可靠的亂數排序演算法呢？

有的！

下面就來介紹：

Fisher-Yates Shuffle

說到亂數排序演算法，其中一個有名的就是Fisher-Yates演算法。

他的算法是從array的最後一個元素開始，和他前方隨機一個位置的元素交換位置。

接下來將倒數第二個元素，和其前方隨機一個位置的元素交換位置，以此類推。

實作如下：

function shuffle(array) {
  for (let i = array.length - 1; i > 0; i--) {
    let j = Math.floor(Math.random() * (i + 1));
    [array[i], array[j]] = [array[j], array[i]];
  }
}

它的運作原理就像是有一個大籤筒，每次抽出一支籤，依序擺在array的最後一個位置、倒數第二個位置…直到所有的籤都被抽出來為止。

這個隨機排序的各種結果的機率是相等的。

用同樣的模擬方法，跑出來得到這樣的結果：

123: 166625
132: 167104
213: 167137
231: 166260
312: 166143
321: 166731

是可以實際在認真的場合使用的亂數排序演算法。

Reference

Shuffle an Array

Fisher-Yates Shuffle

目錄

sort()

神奇的 JavaScript 亂數排序演算法

機率分佈不等

Fisher-Yates Shuffle

Reference

`sort()`