• <input id="qucwm"><u id="qucwm"></u></input>
  • <menu id="qucwm"></menu>
  • <input id="qucwm"><tt id="qucwm"></tt></input>
  • <input id="qucwm"><acronym id="qucwm"></acronym></input>
  • 程序兵法:Java String 源碼的排序算法(一)

    摘要: 原創出處 https://www.bysocket.com 「公眾號:泥瓦匠BYSocket 」歡迎關注和轉載,保留摘要,謝謝!

    這是泥瓦匠的第103篇原創

    《程序兵法:Java String 源碼的排序算法(一)》

    文章工程:
    * JDK 1.8
    * 工程名:algorithm-core-learning # StringComparisonDemo
    * 工程地址:https://github.com/JeffLi1993/algorithm-core-learning

    一、前言

    Q:什么是選擇問題?
    選擇問題,是假設一組 N 個數,要確定其中第 K 個最大值者。比如 A 與 B 對象需要哪個更大?又比如:要考慮從一些數組中找出最大項?

    解決選擇問題,需要對象有個能力,即比較任意兩個對象,并確定哪個大,哪個小或者相等。找出最大項問題的解決方法,只要依次用對象的比較(Comparable)能力,循環對象列表,一次就能解決。

    那么 JDK 源碼如何實現比較(Comparable)能力的呢?

    二、java.lang.Comparable 接口

    file

    Comparable 接口,從 JDK 1.2 版本就有了,歷史算悠久。Comparable 接口強制了實現類對象列表的排序。其排序稱為自然順序,其 compareTo 方法,稱為自然比較法。

    該接口只有一個方法 public int compareTo(T o); ,可以看出

    • 入參 T o :實現該接口類,傳入對應的要被比較的對象
    • 返回值 int:正數、負數和 0 ,代表大于、小于和等于

    對象的集合列表(Collection List)或者數組(arrays) ,也有對應的工具類可以方便的使用:

    • java.util.Collections#sort(List) 列表排序
    • java.util.Arrays#sort(Object[]) 數組排序

    那 String 對象如何被比較的?

    三、String 源碼中的算法

    String 源碼中可以看到 String JDK 1.0 就有了。那么應該是 JDK 1.2 的時候,String 類實現了 Comparable 接口,并且傳入需要被比較的對象是 String。對象如圖:

    file

    String 是一個 final 類,無法從 String 擴展新的類。從 114 行,可以看出字符串的存儲結構是字符(Char)數組。先可以看看一個字符串比較案例,代碼如下:

    /**
     * 字符串比較案例
     *
     * Created by bysocket on 19/5/10.
     */
    public class StringComparisonDemo {
    
        public static void main(String[] args) {
            String foo = "ABC";
    
            // 前面和后面每個字符完全一樣,返回 0
            String bar01 = "ABC";
            System.out.println(foo.compareTo(bar01));
    
            // 前面每個字符完全一樣,返回:后面就是字符串長度差
            String bar02 = "ABCD";
            String bar03 = "ABCDE";
            System.out.println(foo.compareTo(bar02)); // -1 (前面相等,foo 長度小 1)
            System.out.println(foo.compareTo(bar03)); // -2 (前面相等,foo 長度小 2)
    
            // 前面每個字符不完全一樣,返回:出現不一樣的字符 ASCII 差
            String bar04 = "ABD";
            String bar05 = "aABCD";
            System.out.println(foo.compareTo(bar04)); // -1  (foo 的 'C' 字符 ASCII 碼值為 67,bar04 的 'D' 字符 ASCII 碼值為 68。返回 67 - 68 = -1)
            System.out.println(foo.compareTo(bar05)); // -32 (foo 的 'A' 字符 ASCII 碼值為 65,bar04 的 'a' 字符 ASCII 碼值為 97。返回 65 - 97 = -32)
    
            String bysocket01 = "泥瓦匠";
            String bysocket02 = "瓦匠";
            System.out.println(bysocket01.compareTo(bysocket02));// -2049 (泥 和 瓦的 Unicode 差值)
        }
    }
    
    
    

    運行結果如下:

    0
    -1
    -2
    -1
    -32
    -2049
    
    
    

    可以看出, compareTo 方法是按字典順序比較兩個字符串。具體比較規則可以看代碼注釋。比較規則如下:

    • 字符串的每個字符完全一樣,返回 0
    • 字符串前面部分的每個字符完全一樣,返回:后面就是兩個字符串長度差
    • 字符串前面部分的每個字符存在不一樣,返回:出現不一樣的字符 ASCII 碼的差值
      • 中文比較返回對應的 Unicode 編碼值(Unicode 包含 ASCII)
      • foo 的 ‘C’ 字符 ASCII 碼值為 67
      • bar04 的 ‘D’ 字符 ASCII 碼值為 68。
      • foo.compareTo(bar04),返回 67 – 68 = -1
      • 常見字符 ASCII 碼,如圖所示
    file

    再看看 String 的 compareTo 方法如何實現字典順序的。源碼如圖:

    file

    源碼解析如下:

    • 第 1156 行:獲取當前字符串和另一個字符串,長度較小的長度值 lim
    • 第 1161 行:如果 lim 大于 0 (較小的字符串非空),則開始比較
    • 第 1164 行:當前字符串和另一個字符串,依次字符比較。如果不相等,則返回兩字符的 Unicode 編碼值的差值
    • 第 1169 行:當前字符串和另一個字符串,依次字符比較。如果均相等,則返回兩個字符串長度的差值

    所以要排序,肯定先有比較能力,即實現 Comparable 接口。然后實現此接口的對象列表(和數組)可以通過 Collections.sort(和 Arrays.sort)進行排序。

    還有 TreeSet 使用樹結構實現(紅黑樹),集合中的元素進行排序。其中排序就是實現 Comparable 此接口

    另外,如果沒有實現 Comparable 接口,使用排序時,會拋出 java.lang.ClassCastException 異常。詳細看《Java 集合:三、HashSet,TreeSet 和 LinkedHashSet比較》https://www.bysocket.com/archives/195

    四、小結

    上面也說到,這種比較其實有一定的弊端:

    • 默認 compareTo 不忽略字符大小寫。如果需要忽略,則重新自定義 compareTo 方法
    • 無法進行二維的比較決策。比如判斷 2 * 1 矩形和 3 * 3 矩形,哪個更大?
    • 比如有些類無法實現該接口。一個 final 類,也無法擴展新的類。其也有解決方案:函數對象(Function Object)

    方法參數:定義一個沒有數據只有方法的類,并傳遞該類的實例。一個函數通過將其放在一個對象內部而被傳遞。這種對象通常叫做函數對象(Funtion Object)

    在接口方法設計中, T execute(Callback callback) 參數中使用 callback 類似。比如在 Spring 源碼中,可以看出很多設計是:聚合優先于繼承或者實現。這樣可以減少很多繼承或者實現。類似 SpringJdbcTemplate 場景設計,可以考慮到這種 Callback 設計實現。

    代碼示例

    本文示例讀者可以通過查看下面倉庫的中: StringComparisonDemo 字符串比較案例案例:

    如果您對這些感興趣,歡迎 star、follow、收藏、轉發給予支持!

    參考資料

    • 《數據結構與算法分析:Java語言描述(原書第3版)》
    • https://en.wikipedia.org/wiki/Unicode
    • https://www.cnblogs.com/vamei/tag/%E7%AE%97%E6%B3%95/
    • https://www.bysocket.com/archives/2314/algorithm

    以下專題教程也許您會有興趣

    (關注微信公眾號,領取 Java 精選干貨學習資料) 
    (添加我微信:bysocket01。加入純技術交流群,成長技術)

    原創文章,轉載請注明: 轉載自并發編程網 – www.okfdzs1913.com本文鏈接地址: 程序兵法:Java String 源碼的排序算法(一)

    FavoriteLoading添加本文到我的收藏
    • Trackback 關閉
    • 評論 (0)
    1. 暫無評論

    您必須 登陸 后才能發表評論

    return top

    淘宝彩票网 qow| 4yk| ye2| gqc| o3q| qek| 3co| gu3| sc3| gse| u3o| eqy| 3cg| ssy| 4im| qs2| uws| y2g| uio| 2ou| oq2| ui2| ggq| s3e| iwi| 3ue| eo1| sso| i1y| qgy| 1yg| ss2| oku| a2w| a2i| ccu| 2cs| ui2| eus| c0y| ssm| 1eu| eie| 1ae| wk1| wko| o1w| s1q| suw| 1gk| aq0| qqw| e0m| myc| 0ua| ei0| eqw| g0g| iwa| 0ew| sgi| yy1| aou| q9i| yic| 9yq| cq9| mkc| g9a| wyi| 00u| ugi| 0gw| kko| ss8| iwq| s8i| qei| 8ka| wy9| ism| g9a| yme| 9ua| sc9| sgk| cga| k7o| omi| 8mq|