理解java String
关键字: string
一、创建。
好了,知道String是非可变类以后,我们可以进一步了解String的构造方式了。创建一个Stirng对象,主要就有以下两种方式:
- String str1 = new String("abc");
- Stirng str2 = "abc";
虽然两个语句都是返回一个String对象的引用,但是jvm对两者的处理方式是不一样的。对于第一种,jvm会马上在heap中创建一个String对象,然后将该对象的引用返回给用户。对于第二种,jvm首先会在内部维护的strings pool中通过String的 equels 方法查找是对象池中是否存放有该String对象,如果有,则返回已有的String对象给用户,而不会在heap中重新创建一个新的String对象;如果对象池中没有该String对象,jvm则在heap中创建新的String对象,将其引用返回给用户,同时将该引用添加至strings pool中。注意:使用第一种方法创建对象时,jvm是不会主动把该对象放到strings pool里面的,除非程序调用 String的intern方法。看下面的例子:
- String str1 = new String("abc"); //jvm 在堆上创建一个String对象
- //jvm 在strings pool中找不到值为“abc”的字符串,因此
- //在堆上创建一个String对象,并将该对象的引用加入至strings pool中
- //此时堆上有两个String对象
- Stirng str2 = "abc";
- if(str1 == str2){
- System.out.println("str1 == str2");
- }else{
- System.out.println("str1 != str2");
- }
- //打印结果是 str1 != str2,因为它们是堆上两个不同的对象
- String str3 = "abc";
- //此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”
- //因此直接返回str2指向的对象给str3,也就是说str2和str3是指向同一个对象的引用
- if(str2 == str3){
- System.out.println("str2 == str3");
- }else{
- System.out.println("str2 != str3");
- }
- //打印结果为 str2 == str3
再看下面的例子:
- String str1 = new String("abc"); //jvm 在堆上创建一个String对象
- str1 = str1.intern();
- //程序显式将str1放到strings pool中,intern运行过程是这样的:首先查看strings pool
- //有没“abc”对象的引用,没有,则在堆中新建一个对象,然后将新对象的引用加入至
- //strings pool中。执行完该语句后,str1原来指向的String对象已经成为垃圾对象了,随时会
- //被GC收集。
- //此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”
- //因此直接返回str1指向的对象给str2,也就是说str2和str1引用着同一个对象,
- //此时,堆上的有效对象只有一个。
- Stirng str2 = "abc";
- if(str1 == str2){
- System.out.println("str1 == str2");
- }else{
- System.out.println("str1 != str2");
- }
- //打印结果是 str1 == str2
为什么jvm可以这样处理String对象呢?就是因为String的非可变性。既然所引用的对象一旦创建就永不更改,那么多个引用共用一个对象时互不影响。
二、串接(Concatenation)。
java程序员应该都知道滥用String的串接操作符是会影响程序的性能的。性能问题从何而来呢?归根结底就是String类的非可变性。既然String对象都是非可变的,也就是对象一旦创建了就不能够改变其内在状态了,但是串接操作明显是要增长字符串的,也就是要改变String的内部状态,两者出现了矛盾。怎么办呢?要维护String的非可变性,只好在串接完成后新建一个String 对象来表示新产生的字符串了。也就是说,每一次执行串接操作都会导致新对象的产生,如果串接操作执行很频繁,就会导致大量对象的创建,性能问题也就随之而来了。
为了解决这个问题,jdk为String类提供了一个可变的配套类,StringBuffer。使用StringBuffer对象,由于该类是可变的,串接时仅仅时改变了内部数据结构,而不会创建新的对象,因此性能上有很大的提高。针对单线程,jdk 5.0还提供了StringBuilder类,在单线程环境下,由于不用考虑同步问题,使用该类使性能得到进一步的提高。
三、String的长度
我们可以使用串接操作符得到一个长度更长的字符串,那么,String对象最多能容纳多少字符呢?查看String的源代码我们可以得知类String中是使用域 count 来记录对象字符的数量,而count 的类型为 int,因此,我们可以推测最长的长度为 2^32,也就是4G。
不过,我们在编写源代码的时候,如果使用 Sting str = "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。为什么呢?因为在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 = 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。如果超出这个数量,在编译的时候编译器会报错。
评论
两种定义方式下,string的最大长度还不一致哦?
不是string得最大长度不一样,是直接在java 文件里声明,然后编译到class文件里的string受到字符处理得内部条件得限制而已。
String的最大长度不存在不一致问题,理论上它最多能表示2^32个字符。只要是在源文件上定义,由于class文件规范的原因,长度都只能是65534。
不过,我们在编写源代码的时候,如果使用 Sting str = "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。为什么呢?因为在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 = 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。如果超出这个数量,在编译的时候编译器会报错。
两种定义方式下,string的最大长度还不一致哦?
String在内存的长度也受它内部维护的 char[] 数组的最大元素个数影响, Java的数组下标只能是有符号的int, 所以理论的最大个数应该是 2^31
另外我见过很多人把Java String跟Java 传值 还是 传址 调用混淆起来考人, 有C++基础的初学者基本都会被搞蒙, 而实际上跟传值还是传址完全两码事. 如果能结合到这篇文章里一起写写的话, 真是一篇很好的精华文章.
考人的代码比如:
void func(String s)
{
s += "tail";
}
void test()
{
String a = "abc";
func(a);
System.out.println(a); // 问这里输出什么
}
也是写基础方面的,里面的内容个人感觉也不错:
<<java面向对象程序设计教程>>李发致写的,里面的第四章和第五章个人感觉说得比较好.....
to ahuaxuan: 谢谢提醒
PS:写的不错啊(如果是原创的话),干嘛投新手贴阿
- 浏览: 48996 次
- 性别:

- 来自: 广州/成都

- 详细资料
搜索本博客
最近加入圈子
最新评论
-
Two extractors couldn't ...
Update Scrubyt 0.3.4 to 0.4.01
-- by Dustin -
Bridge模式在JDBC中是如何 ...
哦。是这样的吧。JDBC有两个变化点。1.平台的变化2.数据库的变化。所以,这个 ...
-- by fireflyc -
Bridge模式在JDBC中是如何 ...
我觉得是jdbc的应用,实现DAO的时候用到了bridge模式吧,好像在哪里看到 ...
-- by crazycow -
背后的路【3】
一口气看完了...
-- by crazycow -
背后的路【2】
楼主有很多经历和我很像,希望能交个朋友,呵呵:)
-- by crazycow






评论排行榜