Zipf yasası, matematiksel istatistikler kullanılarak formüle edilmiş ampirik bir yasadır ve adını ilk kez öneren dilbilimci George Kingsley Zipf'ten almıştır.
Zipf yasası, kullanılan kelimelerin büyük bir örneği verildiğinde, herhangi bir kelimenin sıklığının, sıklık tablosundaki sıralamasıyla ters orantılı olduğunu belirtir. Yani n numaralı kelime 1/n ile orantılı bir sıklığa sahiptir.
Böylece en sık kullanılan kelime, ikinci en sık kullanılan kelimenin yaklaşık iki katı, üçüncü en sık kullanılan kelimenin üç katı, vb. sıklıkta ortaya çıkacaktır. Örneğin, İngilizce dilindeki bir kelime örneğinde, en sık geçen kelime olan "the", tüm kelimelerin yaklaşık %7'sini oluşturmaktadır (1 milyondan biraz fazla kelimenin 69.971'i). Zipf Yasası'na uygun olarak, ikinci sıradaki "of" kelimesi kelimelerin %3,5'inden biraz fazlasını (36.411 kez) oluştururken, onu "and" (28.852) kelimesi takip etmektedir. Büyük bir örneklemdeki kelimelerin yarısını açıklamak için sadece yaklaşık 135 kelimeye ihtiyaç vardır.
Aynı ilişki, çeşitli ülkelerdeki şehirlerin nüfus sıralamaları, şirket büyüklükleri, gelir sıralamaları vb. gibi dille ilgisi olmayan diğer birçok sıralamada da görülür. Nüfusa göre şehir sıralamalarında dağılımın ortaya çıkışı ilk olarak 1913 yılında Felix Auerbach tarafından fark edilmiştir.
Zipf yasasının neden çoğu dil için geçerli olduğu bilinmemektedir.