Socket编程学习(一)

Socket 编程学习篇

一、概念

TCP（Transmission Control Protocol 传输控制协议）是一种面向连接的、可靠的、基于字节流的传输层通信协议。在简化的计算机网络OSI模型中（四层模型从下到上分别是：物理层/数据链路层、网络层/IP层、传输层TCP/UDP、应用层HTTP/FTP等），它完成第四层传输层所指定的功能，用户数据报协议（UDP）是同一层内另一个重要的传输协议。在因特网协议族（Internet protocol suite）中，TCP层是位于IP层之上，应用层之下的中间层。不同主机的应用层之间经常需要可靠的、像管道一样的连接，但是IP层不提供这样的流机制，而是提供不可靠的包交换。
应用层向TCP层发送用于网间传输的、用8位字节表示的数据流，然后TCP把数据流分区成适当长度的报文段（通常受该计算机连接的网络的数据链路层的最大传输单元（ MTU）的限制）。之后TCP把结果包传给IP层，由它来通过网络将包传送给接收端实体的TCP层。TCP为了保证不发生丢包，就给每个包一个序号，同时序号也保证了传送到接收端实体的包的按序接收。然后接收端实体对已成功收到的包发回一个相应的确认（ACK）；如果发送端实体在合理的往返时延（RTT）内未收到确认，那么对应的数据包就被假设为已丢失将会被进行重传。TCP用一个校验和函数来检验数据是否有错误；在发送和接收时都要计算校验和。

JAVA Socket

所谓socket 通常也称作”套接字“，用于描述IP地址和端口，是一个通信链的句柄。应用程序通常通过”套接字”向网络发出请求或者应答网络请求。

Socket和ServerSocket类库位于java.net包中。ServerSocket用于服务器端，Socket是建立网络连接时使用的。在连接成功时，应用程序两端都会产生一个Socket实例，操作这个实例，完成所需的会话。对于一个网络连接来说，套接字是平等的，并没有差别，不因为在服务器端或在客户端而产生不同级别。不管是Socket还是ServerSocket它们的工作都是通过SocketImpl类及其子类完成的。

重要的Socket API

java.net.Socket继承于java.lang.Object，有八个构造器，其方法并不多，下面介绍使用最频繁的三个方法，其它方法大家可以见JDK-1.3文档。

Accept方法用于产生”阻塞”，直到接受到一个连接，并且返回一个客户端的Socket对象实例。”阻塞”是一个术语，它使程序运行暂时”停留”在这个地方，直到一个会话产生，然后程序继续；通常”阻塞”是由循环产生的。
getInputStream方法获得网络连接输入，同时返回一个InputStream对象实例。
getOutputStream方法连接的另一端将得到输入，同时返回一个OutputStream对象实例。
注意：其中getInputStream和getOutputStream方法均会产生一个IOException，它必须被捕获，因为它们返回的流对象，通常都会被另一个流对象使用。

TCP编程

socket通信时，都是必须先启动服务端，再启动客户端才能建立连接实现通信的

客户端实现

package socket;

import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.Socket;
import java.nio.charset.StandardCharsets;

/*
参考文章：https://www.codenong.com/cs106175296/
 */

/**
 * @author 030
 * @date 15:34 2021/11/8
 * @description TCP通信的客户端：向服务器发送连接请求，给服务器发送数据，读取服务器回写的数据
 * 表示客户端的类：
 * java.net.Socket：此类实现客户端套接字（也可以叫做“套接字”）。套接字是两台机器之间通信的端点。
 * 套接字：包含了IP地址和端口号的网络单位
 * 构造方法：
 * Socket(String host, int port) 创建一个流套接字并将其连接到指定主机上的指定端口号
 * 参数：
 * String host：服务器主机的名称/服务器的ip地址
 * int port：服务器的端口号
 * 成员方法：
 * OutputStream getOutputStream() 返回此套接字的输出流
 * InputStream getInputStream() 返回此套接字的输入流
 * void close() 关闭此套接字
 * <p>
 * 实现步骤：
 * 1. 创建一个客户端对象 Socket，构造方法绑定服务器的IP地址和端口号
 * 2. 使用 Socket 对象中的方法 getOutputStream() 获取网络字节输出流 OutputStream对象
 * 3. 使用网络字节输出流 OutputStream 对象中的方法 write，给服务器发送数据
 * 4. 使用 Socket 对象中的方法 getInputStream() 获取网络字节输入流 InputStream对象
 * 5. 使用网络字节输入流 InputStream对象中的方法 read，读取服务器返回的数据。
 * 6. 释放资源（Socket）
 * 注意：
 * 1. 客户端和服务器端进行交互，必须使用Socket中提供的网络流，不能使用自己创建的流对象
 * 2. 当我们创建客户端对象Socket的时候，就会去请求服务器，并与服务器经过3次握手建立链接通路
 * 这时如果服务器没有启动，那么就会抛出异常
 * 如果服务器已经启动，那么就可以进行交互了
 */
public class TCPClient {
    public static void main(String[] args) throws IOException {
        // 1. 创建一个客户端对象Socket，构造方法绑定服务器的IP地址和端口号
        Socket socket = new Socket("127.0.0.1", 8888);
        // 2. 使用Socket对象中的方法getOutputStream获取网络字节输出流OutputStream对象
        OutputStream os = socket.getOutputStream();
        // 3. 使用网络字节输出流OutputStream对象中的方法write，给服务器发送数据
        String message = "你好服务器，我是客户端";
        os.write(message.getBytes(StandardCharsets.UTF_8));

        /*********解决bug：服务端读取不到 len = -1 标识，会一直处在死循环等待状态ing**********/
        //通过shutdownOutput高速服务器已经发送完数据，后续只能接受数据
        socket.shutdownOutput();

        // 4. 使用Socket对象中的方法getInputStream获取网络字节输入流InputStream对象
        InputStream is = socket.getInputStream();
        int len; // 基本数据类型在方法内部（局部变量）时，可以省略初始化，会默认初始化的；但是作为成员变量时则不可以
        byte[] bytes = new byte[1024];
        // 用于记录 服务端回写 的数据
        StringBuilder sb = new StringBuilder(); // 注意：多线程时要使用 StringBuffer
        while ((len = is.read(bytes)) != -1) {
            // 5. 使用网络字节输入流InputStream对象中的方法read，读取服务器返回的数据。
            // 注意指定编码格式，发送方和接收方一定要统一，建议使用UTF-8
            sb.append(new String(bytes, 0, len, StandardCharsets.UTF_8));
        }
        // 打印输出一下服务端回写的数据
        System.out.println("get message from server: " + sb);
        // 6. 释放资源（Socket）
        is.close();
        os.close();
        socket.close();
    }
}

服务器端实现

package socket;

import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.ServerSocket;
import java.net.Socket;
import java.nio.charset.StandardCharsets;

/*
参考文章：https://www.codenong.com/cs106175296/
 */

/**
 * @author 030
 * @date 20:10 2021/11/8
 * @description TCP通信的服务器端：接收客户端的请求，读取客户端发送的数据，给客户端回写数据
 * 表示服务器的类：
 * java.net.ServerSocket：此类实现服务器套接字
 * <p>
 * 构造方法：
 * ServerSocket(int port) 创建绑定到特定端口的服务器套接字
 * 服务器端必须明确一件事，必须得知道是哪个客户端请求的服务器
 * 所以可以使用 accept() 方法获取到请求的客户端对象 Socket
 * 成员方法：
 * Socket accept() 侦听并接受到此套接字的连接
 * 服务器的实现步骤：
 * 1. 创建服务器 ServerSocket 对象和系统要指定的端口号
 * 2. 使用 ServerSocket 对象中的方法 accept， 获取到请求的客户端对象 Socket
 * 3. 使用Socket对象中的方法 getInputStream() 获取网络字节输入流 InputStream对象
 * 4. 使用网络字节输入流 InputStream 对象中的方法 read，读取客户端发送的数据
 * 5. 使用 Socket 对象中的方法 getOutputStream() 获取网络字节输出流OutputStream对象
 * 6. 使用网络字节输出流 OutputStream 对象中的方法 write，给客户端回写数据
 * 7. 释放资源（Socket， ServerSocket）
 */
public class TCPServer {

    /*一定要先启动 服务端，再启动 客户端才能执行*/
    public static void main(String[] args) throws IOException {
        // 1. 创建服务器 ServerSocket 对象和系统要指定的端口号
        ServerSocket server = new ServerSocket(8888);
        // 2. 使用 ServerSocket 对象中的方法 accept， 获取到请求的客户端对象 Socket
        Socket socket = server.accept();
        // 3. 使用Socket对象中的方法 getInputStream() 获取网络字节输入流 InputStream对象
        InputStream is = socket.getInputStream();
        int len;
        byte[] bytes = new byte[1024];
        StringBuilder sb = new StringBuilder(); // 多线程下注意异常
        // 只有当客户端关闭它的输出流的时候，服务端才能取得结尾的-1
        while ((len = is.read(bytes)) != -1) {
            // 4. 使用网络字节输入流 InputStream 对象中的方法 read，读取客户端发送的数据
            // 注意指定编码格式，发送方和接收方一定要统一，建议使用UTF-8
            sb.append(new String(bytes, 0, len, StandardCharsets.UTF_8));
        }
        // 打印输出 客户端发送的消息
        System.out.println("get message from client: " + sb);

        // 5. 使用 Socket 对象中的方法 getOutputStream() 获取网络字节输出流OutputStream对象
        OutputStream os = socket.getOutputStream();
        // 6. 使用网络字节输出流 OutputStream 对象中的方法 write，给客户端回写数据
        os.write("Hello Client,I get the message...".getBytes(StandardCharsets.UTF_8));
        //  7. 释放资源（Socket， ServerSocket）
        is.close();
        os.close();
        socket.close();
        server.close();
    }
}

说明

如何告知服务端已经发送完信息

其实这个问题还是比较重要的，正常来说，客户端打开一个输出流，如果不做约定，也不关闭它，那么服务端永远不知道客户端是否发送完消息，那么服务端会一直等待下去，直到读取超时。所以怎么告知服务端已经发送完消息就显得特别重要。

1、通过Socket关闭

可以在客户端发送完消息后，采取手动关闭Socket的方式，服务端就会收到相应的关闭信号，那么服务端也就知道网络字节流已经关闭了，这个时候读取操作完成，就可以继续后续的工作了。

但是这种方式有一些缺点：客户端Socket关闭后，将不能再接收服务端发送的消息，也不能再向服务端发送消息了。如果客户端想再次发送消息，需要重新创建Socket连接

2、通过Socket关闭输出流的方式

这种方式就是上面客户端代码中采用的方式，在发送完消息后，直接调用 socket.shutdownOutput()方法，底层会告知服务端我这边已经写完了，那么服务端收到消息后，就能知道已经取完消息了，如果服务端有要返回给客户的消息，那么就可以通过服务端的输出流发送给客户端，如果没有，直接关闭Socket对象就可以了。

这种方式通过关闭客户端的输出流，告知服务端已经写完了，虽然可以读到服务端发送的消息，但是还是有一点点缺点：不能再次发送消息给服务端，如果再次发送，需要重新建立Socket连接。这个缺点，在访问频率比较高的情况下将是一个需要优化的地方。

3、通过约定符号

这种方式的用法，就是双方约定一个字符或者一个短语，来当做消息发送完成的标识，通常这么做就需要改造读取方法。假如约定单端的一行为end，代表发送完成，例如下面的消息，end则代表消息发送完成：
hello abc
end
那么服务端响应的读取操作需要进行如下改造：

Socket socket = server.accept();
// 建立好连接后，从socket中获取输入流，并建立缓冲区进行读取
BufferedReader read=new BufferedReader(new InputStreamReader(socket.getInputStream(),“UTF-8”));
String line;
StringBuilder sb = new StringBuilder();
while ((line = read.readLine()) != null && “end”.equals(line)) {
    //注意指定编码格式，发送方和接收方一定要统一，建议使用UTF-8
    sb.append(line);
}

可以看见，服务端不仅判断是否读到了流的末尾，还判断了是否读到了约定的末尾。

这么做的优缺点如下：
优点：不需要关闭流，当发送完一条命令（消息）后可以再次发送新的命令（消息）
缺点：需要额外的约定结束标志，太简单的容易出现在要发送的消息中，误被结束，太复杂的不好处理，还占带宽。
经过了这么多的优化还是有缺点，难道就没有完美的解决方案吗，答案是有的，看接下来的内容。

4、通过指定长度

如果你了解一点class文件的结构（后续会写，敬请期待），那么你就会佩服这么设计方式，也就是说我们可以在此找灵感，就是我们可以先指定后续命令的长度，然后读取指定长度的内容做为客户端发送的消息。

现在首要的问题就是用几个字节指定长度呢，我们可以算一算：
1个字节：最大256，表示256B
2个字节：最大65536，表示64K
3个字节：最大16777216，表示16M
4个字节：最大4294967296，表示4G

依次类推，这个时候是不是很纠结，最大的当然是最保险的，但是真的有必要选择最大的吗，其实如果你稍微了解一点UTF-8的编码方式（字符编码后续会写，敬请期待），那么你就应该能想到为什么一定要固定表示长度字节的长度呢，我们可以使用变长方式来表示长度的表示，比如：第一个字节首位为0：即0XXXXXXX，表示长度就一个字节，最大128，表示128B
第一个字节首位为110，那么附带后面一个字节表示长度：即110XXXXX 10XXXXXX，最大2048，表示2K
第一个字节首位为1110，那么附带后面二个字节表示长度：即110XXXXX 10XXXXXX 10XXXXXX，最大131072，表示128K。
依次类推，上面提到的这种用法适合高富帅的程序员使用，一般呢，如果用作命名发送，两个字节就够了，如果还不放心4个字节基本就能满足你的所有要求，下面的例子我们将采用2个字节表示长度，目的只是给你一种思路，让你知道有这种方式来获取消息的结尾。

服务端

package socket.type04;

import java.io.InputStream;
import java.net.ServerSocket;
import java.net.Socket;
import java.nio.charset.StandardCharsets;

/**
 * @author 030
 * @date 0:51 2021/11/9
 * @description
 * 如何告知服务端已经发送完信息
 *  实现方式第四种：4、通过指定长度
 */
public class SocketServer {

    public static void main(String[] args) throws Exception {
        // 监听指定的端口
        int port = 55533;
        ServerSocket server = new ServerSocket(port);
        // server将一直等待连接的到来
        System.out.println("server将一直等待连接的到来");
        Socket socket = server.accept();
        // 建立好连接后，从socket中获取输入流，并建立缓冲区进行读取
        InputStream is = socket.getInputStream();
        byte[] bytes;
        // 因为可以复用Socket且能判断长度，所以可以一个Socket用到底
        while (true) {
            // 首先读取两个字节表示的长度
            int first = is.read();
            //如果读取的值为-1 说明到了流的末尾，Socket已经被关闭了，此时将不能再去读取
            if (first == -1) {
                break;
            }
            int second = is.read();
            int length = (first << 8) + second;
            // 然后构造一个指定长的byte数组
            bytes = new byte[length];
            // 然后读取指定长度的消息即可
            is.read(bytes);
            System.out.println("get message from client: " + new String(bytes, StandardCharsets.UTF_8));
        }
        is.close();
        socket.close();
        server.close();
    }
}

客户端

package socket.type04;

import java.io.OutputStream;
import java.net.Socket;
import java.nio.charset.StandardCharsets;

/**
 * @author 030
 * @date 0:52 2021/11/9
 * @description
 * 如何告知服务端已经发送完信息
 *  实现方式第四种：4、通过指定长度
 */
public class SocketClient {

    public static void main(String args[]) throws Exception {
        // 要连接的服务端IP地址和端口
        String host = "127.0.0.1";
        int port = 55533;
        // 与服务端建立连接
        Socket socket = new Socket(host, port);
        // 建立连接后获得输出流
        OutputStream os = socket.getOutputStream();
        String message = "你好服务端";
        //首先需要计算得知消息的长度
        byte[] sendBytes = message.getBytes(StandardCharsets.UTF_8);
        //然后将消息的长度优先发送出去
        os.write(sendBytes.length >> 8);
        os.write(sendBytes.length);
        //然后将消息再次发送出去
        os.write(sendBytes);
        os.flush();
        //==========此处重复发送一次，实际项目中为多个命名，此处只为展示用法
        message = "第二条消息|";
        sendBytes = message.getBytes(StandardCharsets.UTF_8);
        os.write(sendBytes.length >> 8);
        os.write(sendBytes.length);
        os.write(sendBytes);
        os.flush();
        //==========此处重复发送一次，实际项目中为多个命名，此处只为展示用法
        message = "the third message !";
        sendBytes = message.getBytes("UTF-8");
        os.write(sendBytes.length >> 8);
        os.write(sendBytes.length);
        os.write(sendBytes);

        os.close();
        socket.close();
    }
}

客户端要多做的是，在发送消息之前先把消息的长度发送过去。这种事先约定好长度的做法解决了之前提到的种种问题，Redis的Java客户端Jedis就是用这种方式实现的。当然如果是需要服务器返回结果，那么也依然使用这种方式。服务端也是先发送结果的长度，然后客户端进行读取。当然现在流行的是，长度+类型+数据模式的传输方式。