0000: 2f 2a 0a 2a 2a 20 43 6f 70 79 72 69 67 68 74 20 /*.** Copyright
0010: 28 63 29 20 32 30 30 36 20 44 2e 20 52 69 63 68 (c) 2006 D. Rich
0020: 61 72 64 20 48 69 70 70 0a 2a 2a 0a 2a 2a 20 54 ard Hipp.**.** T
0030: 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 20 66 his program is f
0040: 72 65 65 20 73 6f 66 74 77 61 72 65 3b 20 79 6f ree software; yo
0050: 75 20 63 61 6e 20 72 65 64 69 73 74 72 69 62 75 u can redistribu
0060: 74 65 20 69 74 20 61 6e 64 2f 6f 72 0a 2a 2a 20 te it and/or.**
0070: 6d 6f 64 69 66 79 20 69 74 20 75 6e 64 65 72 20 modify it under
0080: 74 68 65 20 74 65 72 6d 73 20 6f 66 20 74 68 65 the terms of the
0090: 20 47 4e 55 20 47 65 6e 65 72 61 6c 20 50 75 62 GNU General Pub
00a0: 6c 69 63 0a 2a 2a 20 4c 69 63 65 6e 73 65 20 76 lic.** License v
00b0: 65 72 73 69 6f 6e 20 32 20 61 73 20 70 75 62 6c ersion 2 as publ
00c0: 69 73 68 65 64 20 62 79 20 74 68 65 20 46 72 65 ished by the Fre
00d0: 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e 64 e Software Found
00e0: 61 74 69 6f 6e 2e 0a 2a 2a 0a 2a 2a 20 54 68 69 ation..**.** Thi
00f0: 73 20 70 72 6f 67 72 61 6d 20 69 73 20 64 69 73 s program is dis
0100: 74 72 69 62 75 74 65 64 20 69 6e 20 74 68 65 20 tributed in the
0110: 68 6f 70 65 20 74 68 61 74 20 69 74 20 77 69 6c hope that it wil
0120: 6c 20 62 65 20 75 73 65 66 75 6c 2c 0a 2a 2a 20 l be useful,.**
0130: 62 75 74 20 57 49 54 48 4f 55 54 20 41 4e 59 20 but WITHOUT ANY
0140: 57 41 52 52 41 4e 54 59 3b 20 77 69 74 68 6f 75 WARRANTY; withou
0150: 74 20 65 76 65 6e 20 74 68 65 20 69 6d 70 6c 69 t even the impli
0160: 65 64 20 77 61 72 72 61 6e 74 79 20 6f 66 0a 2a ed warranty of.*
0170: 2a 20 4d 45 52 43 48 41 4e 54 41 42 49 4c 49 54 * MERCHANTABILIT
0180: 59 20 6f 72 20 46 49 54 4e 45 53 53 20 46 4f 52 Y or FITNESS FOR
0190: 20 41 20 50 41 52 54 49 43 55 4c 41 52 20 50 55 A PARTICULAR PU
01a0: 52 50 4f 53 45 2e 20 20 53 65 65 20 74 68 65 20 RPOSE. See the
01b0: 47 4e 55 0a 2a 2a 20 47 65 6e 65 72 61 6c 20 50 GNU.** General P
01c0: 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20 66 6f ublic License fo
01d0: 72 20 6d 6f 72 65 20 64 65 74 61 69 6c 73 2e 0a r more details..
01e0: 2a 2a 20 0a 2a 2a 20 59 6f 75 20 73 68 6f 75 6c ** .** You shoul
01f0: 64 20 68 61 76 65 20 72 65 63 65 69 76 65 64 20 d have received
0200: 61 20 63 6f 70 79 20 6f 66 20 74 68 65 20 47 4e a copy of the GN
0210: 55 20 47 65 6e 65 72 61 6c 20 50 75 62 6c 69 63 U General Public
0220: 0a 2a 2a 20 4c 69 63 65 6e 73 65 20 61 6c 6f 6e .** License alon
0230: 67 20 77 69 74 68 20 74 68 69 73 20 6c 69 62 72 g with this libr
0240: 61 72 79 3b 20 69 66 20 6e 6f 74 2c 20 77 72 69 ary; if not, wri
0250: 74 65 20 74 6f 20 74 68 65 0a 2a 2a 20 46 72 65 te to the.** Fre
0260: 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e 64 e Software Found
0270: 61 74 69 6f 6e 2c 20 49 6e 63 2e 2c 20 35 39 20 ation, Inc., 59
0280: 54 65 6d 70 6c 65 20 50 6c 61 63 65 20 2d 20 53 Temple Place - S
0290: 75 69 74 65 20 33 33 30 2c 0a 2a 2a 20 42 6f 73 uite 330,.** Bos
02a0: 74 6f 6e 2c 20 4d 41 20 20 30 32 31 31 31 2d 31 ton, MA 02111-1
02b0: 33 30 37 2c 20 55 53 41 2e 0a 2a 2a 0a 2a 2a 20 307, USA..**.**
02c0: 41 75 74 68 6f 72 20 63 6f 6e 74 61 63 74 20 69 Author contact i
02d0: 6e 66 6f 72 6d 61 74 69 6f 6e 3a 0a 2a 2a 20 20 nformation:.**
02e0: 20 64 72 68 40 68 77 61 63 69 2e 63 6f 6d 0a 2a drh@hwaci.com.*
02f0: 2a 20 20 20 68 74 74 70 3a 2f 2f 77 77 77 2e 68 * http://www.h
0300: 77 61 63 69 2e 63 6f 6d 2f 64 72 68 2f 0a 2a 2a waci.com/drh/.**
0310: 0a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a .***************
0320: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0330: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0340: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0350: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0360: 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20 6d 6f 64 75 .**.** This modu
0370: 6c 65 20 69 6d 70 6c 65 6d 65 6e 74 73 20 74 68 le implements th
0380: 65 20 64 65 6c 74 61 20 63 6f 6d 70 72 65 73 73 e delta compress
0390: 20 61 6c 67 6f 72 69 74 68 6d 2e 0a 2a 2a 0a 2a algorithm..**.*
03a0: 2a 20 54 68 6f 75 67 68 20 64 65 76 65 6c 6f 70 * Though develop
03b0: 65 64 20 73 70 65 63 69 66 69 63 61 6c 6c 79 20 ed specifically
03c0: 66 6f 72 20 66 6f 73 73 69 6c 2c 20 74 68 65 20 for fossil, the
03d0: 63 6f 64 65 20 69 6e 20 74 68 69 73 20 66 69 6c code in this fil
03e0: 65 0a 2a 2a 20 69 73 20 67 65 6e 65 72 61 6c 6c e.** is generall
03f0: 79 20 61 70 70 6c 69 61 62 6c 65 20 61 6e 64 20 y appliable and
0400: 69 73 20 74 68 75 73 20 65 61 73 69 6c 79 20 73 is thus easily s
0410: 65 70 61 72 61 74 65 64 20 66 72 6f 6d 20 74 68 eparated from th
0420: 65 0a 2a 2a 20 66 6f 73 73 69 6c 20 73 6f 75 72 e.** fossil sour
0430: 63 65 20 63 6f 64 65 20 62 61 73 65 2e 20 20 4e ce code base. N
0440: 6f 74 68 69 6e 67 20 69 6e 20 74 68 69 73 20 66 othing in this f
0450: 69 6c 65 20 64 65 70 65 6e 64 73 20 6f 6e 20 61 ile depends on a
0460: 6e 79 74 68 69 6e 67 0a 2a 2a 20 65 6c 73 65 20 nything.** else
0470: 69 6e 20 66 6f 73 73 69 6c 2e 0a 2a 2f 0a 23 69 in fossil..*/.#i
0480: 6e 63 6c 75 64 65 20 3c 73 74 64 69 6f 2e 68 3e nclude <stdio.h>
0490: 0a 23 69 6e 63 6c 75 64 65 20 3c 61 73 73 65 72 .#include <asser
04a0: 74 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c 73 t.h>.#include <s
04b0: 74 64 6c 69 62 2e 68 3e 0a 23 69 6e 63 6c 75 64 tdlib.h>.#includ
04c0: 65 20 3c 73 74 72 69 6e 67 2e 68 3e 0a 0a 2f 2a e <string.h>../*
04d0: 0a 2a 2a 20 4d 61 63 72 6f 73 20 66 6f 72 20 74 .** Macros for t
04e0: 75 72 6e 69 6e 67 20 64 65 62 75 67 67 69 6e 67 urning debugging
04f0: 20 70 72 69 6e 74 66 73 20 6f 6e 20 61 6e 64 20 printfs on and
0500: 6f 66 66 0a 2a 2f 0a 23 69 66 20 30 0a 23 20 64 off.*/.#if 0.# d
0510: 65 66 69 6e 65 20 44 45 42 55 47 31 28 58 29 20 efine DEBUG1(X)
0520: 58 0a 23 65 6c 73 65 0a 23 20 64 65 66 69 6e 65 X.#else.# define
0530: 20 44 45 42 55 47 31 28 58 29 0a 23 65 6e 64 69 DEBUG1(X).#endi
0540: 66 0a 23 69 66 20 30 0a 23 64 65 66 69 6e 65 20 f.#if 0.#define
0550: 44 45 42 55 47 32 28 58 29 20 58 0a 2f 2a 0a 2a DEBUG2(X) X./*.*
0560: 2a 20 46 6f 72 20 64 65 62 75 67 67 69 6e 67 3a * For debugging:
0570: 0a 2a 2a 20 50 72 69 6e 74 20 31 36 20 63 68 61 .** Print 16 cha
0580: 72 61 63 74 65 72 73 20 6f 66 20 74 65 78 74 20 racters of text
0590: 66 72 6f 6d 20 7a 42 75 66 0a 2a 2f 0a 73 74 61 from zBuf.*/.sta
05a0: 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20 2a tic const char *
05b0: 70 72 69 6e 74 31 36 28 63 6f 6e 73 74 20 63 68 print16(const ch
05c0: 61 72 20 2a 7a 29 7b 0a 20 20 69 6e 74 20 69 3b ar *z){. int i;
05d0: 0a 20 20 73 74 61 74 69 63 20 63 68 61 72 20 7a . static char z
05e0: 42 75 66 5b 32 30 5d 3b 0a 20 20 66 6f 72 28 69 Buf[20];. for(i
05f0: 3d 30 3b 20 69 3c 31 36 3b 20 69 2b 2b 29 7b 0a =0; i<16; i++){.
0600: 20 20 20 20 69 66 28 20 7a 5b 69 5d 3e 3d 30 78 if( z[i]>=0x
0610: 32 30 20 26 26 20 7a 5b 69 5d 3c 3d 30 78 37 65 20 && z[i]<=0x7e
0620: 20 29 7b 0a 20 20 20 20 20 20 7a 42 75 66 5b 69 ){. zBuf[i
0630: 5d 20 3d 20 7a 5b 69 5d 3b 0a 20 20 20 20 7d 65 ] = z[i];. }e
0640: 6c 73 65 7b 0a 20 20 20 20 20 20 7a 42 75 66 5b lse{. zBuf[
0650: 69 5d 20 3d 20 27 2e 27 3b 0a 20 20 20 20 7d 0a i] = '.';. }.
0660: 20 20 7d 0a 20 20 7a 42 75 66 5b 69 5d 20 3d 20 }. zBuf[i] =
0670: 30 3b 0a 20 20 72 65 74 75 72 6e 20 7a 42 75 66 0;. return zBuf
0680: 3b 0a 7d 0a 23 65 6c 73 65 0a 23 20 64 65 66 69 ;.}.#else.# defi
0690: 6e 65 20 44 45 42 55 47 32 28 58 29 0a 23 65 6e ne DEBUG2(X).#en
06a0: 64 69 66 0a 0a 0a 2f 2a 0a 2a 2a 20 54 68 65 20 dif.../*.** The
06b0: 22 75 33 32 22 20 74 79 70 65 20 6d 75 73 74 20 "u32" type must
06c0: 62 65 20 61 6e 20 75 6e 73 69 67 6e 65 64 20 33 be an unsigned 3
06d0: 32 2d 62 69 74 20 69 6e 74 65 67 65 72 2e 20 20 2-bit integer.
06e0: 41 64 6a 75 73 74 20 74 68 69 73 0a 2a 2f 0a 74 Adjust this.*/.t
06f0: 79 70 65 64 65 66 20 75 6e 73 69 67 6e 65 64 20 ypedef unsigned
0700: 69 6e 74 20 75 33 32 3b 0a 0a 2f 2a 0a 2a 2a 20 int u32;../*.**
0710: 4d 75 73 74 20 62 65 20 61 20 31 36 2d 62 69 74 Must be a 16-bit
0720: 20 76 61 6c 75 65 20 0a 2a 2f 0a 74 79 70 65 64 value .*/.typed
0730: 65 66 20 73 68 6f 72 74 20 69 6e 74 20 73 31 36 ef short int s16
0740: 3b 0a 74 79 70 65 64 65 66 20 75 6e 73 69 67 6e ;.typedef unsign
0750: 65 64 20 73 68 6f 72 74 20 69 6e 74 20 75 31 36 ed short int u16
0760: 3b 0a 0a 2f 2a 0a 2a 2a 20 54 68 65 20 77 69 64 ;../*.** The wid
0770: 74 68 20 6f 66 20 61 20 68 61 73 68 20 77 69 6e th of a hash win
0780: 64 6f 77 20 69 6e 20 62 79 74 65 73 2e 20 20 54 dow in bytes. T
0790: 68 65 20 61 6c 67 6f 72 69 74 68 6d 20 6f 6e 6c he algorithm onl
07a0: 79 20 77 6f 72 6b 73 20 69 66 20 74 68 69 73 0a y works if this.
07b0: 2a 2a 20 69 73 20 61 20 70 6f 77 65 72 20 6f 66 ** is a power of
07c0: 20 32 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 4e 2..*/.#define N
07d0: 48 41 53 48 20 31 36 0a 0a 2f 2a 0a 2a 2a 20 54 HASH 16../*.** T
07e0: 68 65 20 63 75 72 72 65 6e 74 20 73 74 61 74 65 he current state
07f0: 20 6f 66 20 74 68 65 20 72 6f 6c 6c 69 6e 67 20 of the rolling
0800: 68 61 73 68 2e 0a 2a 2a 0a 2a 2a 20 7a 5b 5d 20 hash..**.** z[]
0810: 68 6f 6c 64 73 20 74 68 65 20 76 61 6c 75 65 73 holds the values
0820: 20 74 68 61 74 20 68 61 76 65 20 62 65 65 6e 20 that have been
0830: 68 61 73 68 65 64 2e 20 20 7a 5b 5d 20 69 73 20 hashed. z[] is
0840: 61 20 63 69 72 63 75 6c 61 72 20 62 75 66 66 65 a circular buffe
0850: 72 2e 0a 2a 2a 20 7a 5b 69 5d 20 69 73 20 74 68 r..** z[i] is th
0860: 65 20 66 69 72 73 74 20 65 6e 74 72 79 20 61 6e e first entry an
0870: 64 20 7a 5b 28 69 2b 4e 48 41 53 48 2d 31 29 25 d z[(i+NHASH-1)%
0880: 4e 48 41 53 48 5d 20 69 73 20 74 68 65 20 6c 61 NHASH] is the la
0890: 73 74 20 65 6e 74 72 79 20 6f 66 20 0a 2a 2a 20 st entry of .**
08a0: 74 68 65 20 77 69 6e 64 6f 77 2e 0a 2a 2a 0a 2a the window..**.*
08b0: 2a 20 48 61 73 68 2e 61 20 69 73 20 74 68 65 20 * Hash.a is the
08c0: 73 75 6d 20 6f 66 20 61 6c 6c 20 65 6c 65 6d 65 sum of all eleme
08d0: 6e 74 73 20 6f 66 20 68 61 73 68 2e 7a 5b 5d 2e nts of hash.z[].
08e0: 20 20 48 61 73 68 2e 62 20 69 73 20 61 20 77 65 Hash.b is a we
08f0: 69 67 68 74 65 64 0a 2a 2a 20 73 75 6d 2e 20 20 ighted.** sum.
0900: 48 61 73 68 2e 62 20 69 73 20 7a 5b 69 5d 2a 4e Hash.b is z[i]*N
0910: 48 41 53 48 20 2b 20 7a 5b 69 2b 31 5d 2a 28 4e HASH + z[i+1]*(N
0920: 48 41 53 48 2d 31 29 20 2b 20 2e 2e 2e 20 2b 20 HASH-1) + ... +
0930: 7a 5b 69 2b 4e 48 41 53 48 2d 31 5d 2a 31 2e 0a z[i+NHASH-1]*1..
0940: 2a 2a 20 28 45 61 63 68 20 69 6e 64 65 78 20 66 ** (Each index f
0950: 6f 72 20 7a 5b 5d 20 73 68 6f 75 6c 64 20 62 65 or z[] should be
0960: 20 6d 6f 64 75 6c 65 20 4e 48 41 53 48 2c 20 6f module NHASH, o
0970: 66 20 63 6f 75 72 73 65 2e 20 20 54 68 65 20 25 f course. The %
0980: 4e 48 41 53 48 20 6f 70 65 72 61 74 6f 72 0a 2a NHASH operator.*
0990: 2a 20 69 73 20 6f 6d 69 74 74 65 64 20 69 6e 20 * is omitted in
09a0: 74 68 65 20 70 72 69 6f 72 20 65 78 70 72 65 73 the prior expres
09b0: 73 69 6f 6e 20 66 6f 72 20 62 72 65 76 69 74 79 sion for brevity
09c0: 2e 29 0a 2a 2f 0a 74 79 70 65 64 65 66 20 73 74 .).*/.typedef st
09d0: 72 75 63 74 20 68 61 73 68 20 68 61 73 68 3b 0a ruct hash hash;.
09e0: 73 74 72 75 63 74 20 68 61 73 68 20 7b 0a 20 20 struct hash {.
09f0: 75 31 36 20 61 2c 20 62 3b 20 20 20 20 20 20 20 u16 a, b;
0a00: 20 20 2f 2a 20 48 61 73 68 20 76 61 6c 75 65 73 /* Hash values
0a10: 20 2a 2f 0a 20 20 75 31 36 20 69 3b 20 20 20 20 */. u16 i;
0a20: 20 20 20 20 20 20 20 20 2f 2a 20 53 74 61 72 74 /* Start
0a30: 20 6f 66 20 74 68 65 20 68 61 73 68 20 77 69 6e of the hash win
0a40: 64 6f 77 20 2a 2f 0a 20 20 63 68 61 72 20 7a 5b dow */. char z[
0a50: 4e 48 41 53 48 5d 3b 20 20 20 20 2f 2a 20 54 68 NHASH]; /* Th
0a60: 65 20 76 61 6c 75 65 73 20 74 68 61 74 20 68 61 e values that ha
0a70: 76 65 20 62 65 65 6e 20 68 61 73 68 65 64 20 2a ve been hashed *
0a80: 2f 0a 7d 3b 0a 0a 2f 2a 0a 2a 2a 20 49 6e 69 74 /.};../*.** Init
0a90: 69 61 6c 69 7a 65 20 74 68 65 20 72 6f 6c 6c 69 ialize the rolli
0aa0: 6e 67 20 68 61 73 68 20 75 73 69 6e 67 20 74 68 ng hash using th
0ab0: 65 20 66 69 72 73 74 20 4e 48 41 53 48 20 63 68 e first NHASH ch
0ac0: 61 72 61 63 74 65 72 73 20 6f 66 20 7a 5b 5d 0a aracters of z[].
0ad0: 2a 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20 68 */.static void h
0ae0: 61 73 68 5f 69 6e 69 74 28 68 61 73 68 20 2a 70 ash_init(hash *p
0af0: 48 61 73 68 2c 20 63 6f 6e 73 74 20 63 68 61 72 Hash, const char
0b00: 20 2a 7a 29 7b 0a 20 20 75 31 36 20 61 2c 20 62 *z){. u16 a, b
0b10: 2c 20 69 3b 0a 20 20 61 20 3d 20 62 20 3d 20 30 , i;. a = b = 0
0b20: 3b 0a 20 20 66 6f 72 28 69 3d 30 3b 20 69 3c 4e ;. for(i=0; i<N
0b30: 48 41 53 48 3b 20 69 2b 2b 29 7b 0a 20 20 20 20 HASH; i++){.
0b40: 61 20 2b 3d 20 7a 5b 69 5d 3b 0a 20 20 20 20 62 a += z[i];. b
0b50: 20 2b 3d 20 28 4e 48 41 53 48 2d 69 29 2a 7a 5b += (NHASH-i)*z[
0b60: 69 5d 3b 0a 20 20 20 20 70 48 61 73 68 2d 3e 7a i];. pHash->z
0b70: 5b 69 5d 20 3d 20 7a 5b 69 5d 3b 0a 20 20 7d 0a [i] = z[i];. }.
0b80: 20 20 70 48 61 73 68 2d 3e 61 20 3d 20 61 20 26 pHash->a = a &
0b90: 20 30 78 66 66 66 66 3b 0a 20 20 70 48 61 73 68 0xffff;. pHash
0ba0: 2d 3e 62 20 3d 20 62 20 26 20 30 78 66 66 66 66 ->b = b & 0xffff
0bb0: 3b 0a 20 20 70 48 61 73 68 2d 3e 69 20 3d 20 30 ;. pHash->i = 0
0bc0: 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 41 64 76 61 6e ;.}../*.** Advan
0bd0: 63 65 20 74 68 65 20 72 6f 6c 6c 69 6e 67 20 68 ce the rolling h
0be0: 61 73 68 20 62 79 20 61 20 73 69 6e 67 6c 65 20 ash by a single
0bf0: 63 68 61 72 61 63 74 65 72 20 22 63 22 0a 2a 2f character "c".*/
0c00: 0a 73 74 61 74 69 63 20 76 6f 69 64 20 68 61 73 .static void has
0c10: 68 5f 6e 65 78 74 28 68 61 73 68 20 2a 70 48 61 h_next(hash *pHa
0c20: 73 68 2c 20 69 6e 74 20 63 29 7b 0a 20 20 75 31 sh, int c){. u1
0c30: 36 20 6f 6c 64 20 3d 20 70 48 61 73 68 2d 3e 7a 6 old = pHash->z
0c40: 5b 70 48 61 73 68 2d 3e 69 5d 3b 0a 20 20 70 48 [pHash->i];. pH
0c50: 61 73 68 2d 3e 7a 5b 70 48 61 73 68 2d 3e 69 5d ash->z[pHash->i]
0c60: 20 3d 20 63 3b 0a 20 20 70 48 61 73 68 2d 3e 69 = c;. pHash->i
0c70: 20 3d 20 28 70 48 61 73 68 2d 3e 69 2b 31 29 26 = (pHash->i+1)&
0c80: 28 4e 48 41 53 48 2d 31 29 3b 0a 20 20 70 48 61 (NHASH-1);. pHa
0c90: 73 68 2d 3e 61 20 3d 20 70 48 61 73 68 2d 3e 61 sh->a = pHash->a
0ca0: 20 2d 20 6f 6c 64 20 2b 20 63 3b 0a 20 20 70 48 - old + c;. pH
0cb0: 61 73 68 2d 3e 62 20 3d 20 70 48 61 73 68 2d 3e ash->b = pHash->
0cc0: 62 20 2d 20 4e 48 41 53 48 2a 6f 6c 64 20 2b 20 b - NHASH*old +
0cd0: 70 48 61 73 68 2d 3e 61 3b 0a 7d 0a 0a 2f 2a 0a pHash->a;.}../*.
0ce0: 2a 2a 20 52 65 74 75 72 6e 20 61 20 33 32 2d 62 ** Return a 32-b
0cf0: 69 74 20 68 61 73 68 20 76 61 6c 75 65 0a 2a 2f it hash value.*/
0d00: 0a 73 74 61 74 69 63 20 75 33 32 20 68 61 73 68 .static u32 hash
0d10: 5f 33 32 62 69 74 28 68 61 73 68 20 2a 70 48 61 _32bit(hash *pHa
0d20: 73 68 29 7b 0a 20 20 72 65 74 75 72 6e 20 28 70 sh){. return (p
0d30: 48 61 73 68 2d 3e 61 20 26 20 30 78 66 66 66 66 Hash->a & 0xffff
0d40: 29 20 7c 20 28 28 28 75 33 32 29 28 70 48 61 73 ) | (((u32)(pHas
0d50: 68 2d 3e 62 20 26 20 30 78 66 66 66 66 29 29 3c h->b & 0xffff))<
0d60: 3c 31 36 29 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 57 <16);.}../*.** W
0d70: 72 69 74 65 20 61 6e 20 62 61 73 65 2d 36 34 20 rite an base-64
0d80: 69 6e 74 65 67 65 72 20 69 6e 74 6f 20 74 68 65 integer into the
0d90: 20 67 69 76 65 6e 20 62 75 66 66 65 72 2e 0a 2a given buffer..*
0da0: 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20 70 75 /.static void pu
0db0: 74 49 6e 74 28 75 6e 73 69 67 6e 65 64 20 69 6e tInt(unsigned in
0dc0: 74 20 76 2c 20 63 68 61 72 20 2a 2a 70 7a 29 7b t v, char **pz){
0dd0: 0a 20 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20 . static const
0de0: 63 68 61 72 20 7a 44 69 67 69 74 73 5b 5d 20 3d char zDigits[] =
0df0: 20 0a 20 20 20 20 22 30 31 32 33 34 35 36 37 38 . "012345678
0e00: 39 41 42 43 44 45 46 47 48 49 4a 4b 4c 4d 4e 4f 9ABCDEFGHIJKLMNO
0e10: 50 51 52 53 54 55 56 57 58 59 5a 5f 61 62 63 64 PQRSTUVWXYZ_abcd
0e20: 65 66 67 68 69 6a 6b 6c 6d 6e 6f 70 71 72 73 74 efghijklmnopqrst
0e30: 75 76 77 78 79 7a 7e 22 3b 0a 20 20 2f 2a 20 20 uvwxyz~";. /*
0e40: 31 32 33 34 35 36 37 38 39 20 31 32 33 34 35 36 123456789 123456
0e50: 37 38 39 20 31 32 33 34 35 36 37 38 39 20 31 32 789 123456789 12
0e60: 33 34 35 36 37 38 39 20 31 32 33 34 35 36 37 38 3456789 12345678
0e70: 39 20 31 32 33 34 35 36 37 38 39 20 31 32 33 20 9 123456789 123
0e80: 2a 2f 0a 20 20 69 6e 74 20 69 2c 20 6a 3b 0a 20 */. int i, j;.
0e90: 20 63 68 61 72 20 7a 42 75 66 5b 32 30 5d 3b 0a char zBuf[20];.
0ea0: 20 20 69 66 28 20 76 3d 3d 30 20 29 7b 0a 20 20 if( v==0 ){.
0eb0: 20 20 2a 28 2a 70 7a 29 2b 2b 20 3d 20 27 30 27 *(*pz)++ = '0'
0ec0: 3b 0a 20 20 20 20 72 65 74 75 72 6e 3b 0a 20 20 ;. return;.
0ed0: 7d 0a 20 20 66 6f 72 28 69 3d 30 3b 20 76 3e 30 }. for(i=0; v>0
0ee0: 3b 20 69 2b 2b 2c 20 76 3e 3e 3d 36 29 7b 0a 20 ; i++, v>>=6){.
0ef0: 20 20 20 7a 42 75 66 5b 69 5d 20 3d 20 7a 44 69 zBuf[i] = zDi
0f00: 67 69 74 73 5b 76 26 30 78 33 66 5d 3b 0a 20 20 gits[v&0x3f];.
0f10: 7d 0a 20 20 66 6f 72 28 6a 3d 69 2d 31 3b 20 6a }. for(j=i-1; j
0f20: 3e 3d 30 3b 20 6a 2d 2d 29 7b 0a 20 20 20 20 2a >=0; j--){. *
0f30: 28 2a 70 7a 29 2b 2b 20 3d 20 7a 42 75 66 5b 6a (*pz)++ = zBuf[j
0f40: 5d 3b 0a 20 20 7d 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 ];. }.}../*.**
0f50: 52 65 61 64 20 62 79 74 65 73 20 66 72 6f 6d 20 Read bytes from
0f60: 2a 70 7a 20 61 6e 64 20 63 6f 6e 76 65 72 74 20 *pz and convert
0f70: 74 68 65 6d 20 69 6e 74 6f 20 61 20 70 6f 73 69 them into a posi
0f80: 74 69 76 65 20 69 6e 74 65 67 65 72 2e 20 20 57 tive integer. W
0f90: 68 65 6e 0a 2a 2a 20 66 69 6e 69 73 68 65 64 2c hen.** finished,
0fa0: 20 6c 65 61 76 65 20 2a 70 7a 20 70 6f 69 6e 74 leave *pz point
0fb0: 69 6e 67 20 74 6f 20 74 68 65 20 66 69 72 73 74 ing to the first
0fc0: 20 63 68 61 72 61 63 74 65 72 20 70 61 73 74 20 character past
0fd0: 74 68 65 20 65 6e 64 20 6f 66 0a 2a 2a 20 74 68 the end of.** th
0fe0: 65 20 69 6e 74 65 67 65 72 2e 20 20 54 68 65 20 e integer. The
0ff0: 2a 70 4c 65 6e 20 70 61 72 61 6d 65 74 65 72 20 *pLen parameter
1000: 68 6f 6c 64 73 20 74 68 65 20 6c 65 6e 67 74 68 holds the length
1010: 20 6f 66 20 74 68 65 20 73 74 72 69 6e 67 0a 2a of the string.*
1020: 2a 20 69 6e 20 2a 70 7a 20 61 6e 64 20 69 73 20 * in *pz and is
1030: 64 65 63 72 65 6d 65 6e 74 65 64 20 6f 6e 63 65 decremented once
1040: 20 66 6f 72 20 65 61 63 68 20 63 68 61 72 61 63 for each charac
1050: 74 65 72 20 69 6e 20 74 68 65 20 69 6e 74 65 67 ter in the integ
1060: 65 72 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 75 6e er..*/.static un
1070: 73 69 67 6e 65 64 20 69 6e 74 20 67 65 74 49 6e signed int getIn
1080: 74 28 63 6f 6e 73 74 20 63 68 61 72 20 2a 2a 70 t(const char **p
1090: 7a 2c 20 69 6e 74 20 2a 70 4c 65 6e 29 7b 0a 20 z, int *pLen){.
10a0: 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20 73 69 static const si
10b0: 67 6e 65 64 20 63 68 61 72 20 7a 56 61 6c 75 65 gned char zValue
10c0: 5b 5d 20 3d 20 7b 0a 20 20 20 20 2d 31 2c 20 2d [] = {. -1, -
10d0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
10e0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 20 20 2d 31 2c 1, -1, -1, -1,
10f0: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1100: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 0a 20 20 20 -1, -1, -1,.
1110: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1120: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1130: 20 20 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d -1, -1, -1, -
1140: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
1150: 31 2c 0a 20 20 20 20 2d 31 2c 20 2d 31 2c 20 2d 1,. -1, -1, -
1160: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
1170: 31 2c 20 2d 31 2c 20 20 20 2d 31 2c 20 2d 31 2c 1, -1, -1, -1,
1180: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1190: 20 2d 31 2c 20 2d 31 2c 0a 20 20 20 20 20 30 2c -1, -1,. 0,
11a0: 20 20 31 2c 20 20 32 2c 20 20 33 2c 20 20 34 2c 1, 2, 3, 4,
11b0: 20 20 35 2c 20 20 36 2c 20 20 37 2c 20 20 20 20 5, 6, 7,
11c0: 38 2c 20 20 39 2c 20 2d 31 2c 20 2d 31 2c 20 2d 8, 9, -1, -1, -
11d0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 0a 20 1, -1, -1, -1,.
11e0: 20 20 20 2d 31 2c 20 31 30 2c 20 31 31 2c 20 31 -1, 10, 11, 1
11f0: 32 2c 20 31 33 2c 20 31 34 2c 20 31 35 2c 20 31 2, 13, 14, 15, 1
1200: 36 2c 20 20 20 31 37 2c 20 31 38 2c 20 31 39 2c 6, 17, 18, 19,
1210: 20 32 30 2c 20 32 31 2c 20 32 32 2c 20 32 33 2c 20, 21, 22, 23,
1220: 20 32 34 2c 0a 20 20 20 20 32 35 2c 20 32 36 2c 24,. 25, 26,
1230: 20 32 37 2c 20 32 38 2c 20 32 39 2c 20 33 30 2c 27, 28, 29, 30,
1240: 20 33 31 2c 20 33 32 2c 20 20 20 33 33 2c 20 33 31, 32, 33, 3
1250: 34 2c 20 33 35 2c 20 2d 31 2c 20 2d 31 2c 20 2d 4, 35, -1, -1, -
1260: 31 2c 20 2d 31 2c 20 33 36 2c 0a 20 20 20 20 2d 1, -1, 36,. -
1270: 31 2c 20 33 37 2c 20 33 38 2c 20 33 39 2c 20 34 1, 37, 38, 39, 4
1280: 30 2c 20 34 31 2c 20 34 32 2c 20 34 33 2c 20 20 0, 41, 42, 43,
1290: 20 34 34 2c 20 34 35 2c 20 34 36 2c 20 34 37 2c 44, 45, 46, 47,
12a0: 20 34 38 2c 20 34 39 2c 20 35 30 2c 20 35 31 2c 48, 49, 50, 51,
12b0: 0a 20 20 20 20 35 32 2c 20 35 33 2c 20 35 34 2c . 52, 53, 54,
12c0: 20 35 35 2c 20 35 36 2c 20 35 37 2c 20 35 38 2c 55, 56, 57, 58,
12d0: 20 35 39 2c 20 20 20 36 30 2c 20 36 31 2c 20 36 59, 60, 61, 6
12e0: 32 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 36 2, -1, -1, -1, 6
12f0: 33 2c 20 2d 31 2c 0a 20 20 7d 3b 0a 20 20 75 6e 3, -1,. };. un
1300: 73 69 67 6e 65 64 20 69 6e 74 20 76 20 3d 20 30 signed int v = 0
1310: 3b 0a 20 20 69 6e 74 20 63 3b 0a 20 20 75 6e 73 ;. int c;. uns
1320: 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 20 3d 20 igned char *z =
1330: 28 75 6e 73 69 67 6e 65 64 20 63 68 61 72 2a 29 (unsigned char*)
1340: 2a 70 7a 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20 *pz;. unsigned
1350: 63 68 61 72 20 2a 7a 53 74 61 72 74 20 3d 20 7a char *zStart = z
1360: 3b 0a 20 20 77 68 69 6c 65 28 20 28 63 20 3d 20 ;. while( (c =
1370: 7a 56 61 6c 75 65 5b 30 78 37 66 26 2a 28 7a 2b zValue[0x7f&*(z+
1380: 2b 29 5d 29 3e 3d 30 20 29 7b 0a 20 20 20 20 20 +)])>=0 ){.
1390: 76 20 3d 20 28 76 3c 3c 36 29 20 2b 20 63 3b 0a v = (v<<6) + c;.
13a0: 20 20 7d 0a 20 20 7a 2d 2d 3b 0a 20 20 2a 70 4c }. z--;. *pL
13b0: 65 6e 20 2d 3d 20 7a 20 2d 20 7a 53 74 61 72 74 en -= z - zStart
13c0: 3b 0a 20 20 2a 70 7a 20 3d 20 28 63 68 61 72 2a ;. *pz = (char*
13d0: 29 7a 3b 0a 20 20 72 65 74 75 72 6e 20 76 3b 0a )z;. return v;.
13e0: 7d 0a 0a 2f 2a 0a 2a 2a 20 52 65 74 75 72 6e 20 }../*.** Return
13f0: 74 68 65 20 6e 75 6d 62 65 72 20 64 69 67 69 74 the number digit
1400: 73 20 69 6e 20 74 68 65 20 62 61 73 65 2d 34 36 s in the base-46
1410: 20 72 65 70 72 65 73 65 6e 74 61 74 69 6f 6e 20 representation
1420: 6f 66 20 61 20 70 6f 73 69 74 69 76 65 20 69 6e of a positive in
1430: 74 65 67 65 72 0a 2a 2f 0a 73 74 61 74 69 63 20 teger.*/.static
1440: 69 6e 74 20 64 69 67 69 74 5f 63 6f 75 6e 74 28 int digit_count(
1450: 69 6e 74 20 76 29 7b 0a 20 20 75 6e 73 69 67 6e int v){. unsign
1460: 65 64 20 69 6e 74 20 69 2c 20 78 3b 0a 20 20 66 ed int i, x;. f
1470: 6f 72 28 69 3d 31 2c 20 78 3d 36 34 3b 20 76 3e or(i=1, x=64; v>
1480: 3d 78 3b 20 69 2b 2b 2c 20 78 20 3c 3c 3d 20 36 =x; i++, x <<= 6
1490: 29 7b 7d 0a 20 20 72 65 74 75 72 6e 20 69 3b 0a ){}. return i;.
14a0: 7d 0a 0a 2f 2a 0a 2a 2a 20 43 6f 6d 70 75 74 65 }../*.** Compute
14b0: 20 61 20 33 32 2d 62 69 74 20 63 68 65 63 6b 73 a 32-bit checks
14c0: 75 6d 20 6f 6e 20 74 68 65 20 4e 2d 62 79 74 65 um on the N-byte
14d0: 20 62 75 66 66 65 72 2e 20 20 52 65 74 75 72 6e buffer. Return
14e0: 20 74 68 65 20 72 65 73 75 6c 74 2e 0a 2a 2f 0a the result..*/.
14f0: 73 74 61 74 69 63 20 75 6e 73 69 67 6e 65 64 20 static unsigned
1500: 69 6e 74 20 63 68 65 63 6b 73 75 6d 28 63 6f 6e int checksum(con
1510: 73 74 20 63 68 61 72 20 2a 7a 49 6e 2c 20 69 6e st char *zIn, in
1520: 74 20 4e 29 7b 0a 20 20 63 6f 6e 73 74 20 75 6e t N){. const un
1530: 73 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 20 3d signed char *z =
1540: 20 28 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 (const unsigned
1550: 20 63 68 61 72 2a 29 7a 49 6e 3b 0a 20 20 75 6e char*)zIn;. un
1560: 73 69 67 6e 65 64 20 69 6e 74 20 73 75 6d 20 3d signed int sum =
1570: 20 30 3b 0a 20 20 77 68 69 6c 65 28 20 4e 3e 3d 0;. while( N>=
1580: 34 20 29 7b 0a 20 20 20 20 73 75 6d 20 2b 3d 20 4 ){. sum +=
1590: 28 7a 5b 30 5d 3c 3c 32 34 29 20 7c 20 28 7a 5b (z[0]<<24) | (z[
15a0: 31 5d 3c 3c 31 36 29 20 7c 20 28 7a 5b 32 5d 3c 1]<<16) | (z[2]<
15b0: 3c 38 29 20 7c 20 7a 5b 33 5d 3b 0a 20 20 20 20 <8) | z[3];.
15c0: 7a 20 2b 3d 20 34 3b 0a 20 20 20 20 4e 20 2d 3d z += 4;. N -=
15d0: 20 34 3b 0a 20 20 7d 0a 20 20 69 66 28 20 4e 3e 4;. }. if( N>
15e0: 30 20 29 7b 0a 20 20 20 20 75 6e 73 69 67 6e 65 0 ){. unsigne
15f0: 64 20 63 68 61 72 20 7a 42 75 66 5b 34 5d 3b 0a d char zBuf[4];.
1600: 20 20 20 20 6d 65 6d 73 65 74 28 7a 42 75 66 2c memset(zBuf,
1610: 20 30 2c 20 73 69 7a 65 6f 66 28 7a 42 75 66 29 0, sizeof(zBuf)
1620: 29 3b 0a 20 20 20 20 6d 65 6d 63 70 79 28 7a 42 );. memcpy(zB
1630: 75 66 2c 20 7a 2c 20 4e 29 3b 0a 20 20 20 20 7a uf, z, N);. z
1640: 20 3d 20 7a 42 75 66 3b 0a 20 20 20 20 73 75 6d = zBuf;. sum
1650: 20 2b 3d 20 28 7a 5b 30 5d 3c 3c 32 34 29 20 7c += (z[0]<<24) |
1660: 20 28 7a 5b 31 5d 3c 3c 31 36 29 20 7c 20 28 7a (z[1]<<16) | (z
1670: 5b 32 5d 3c 3c 38 29 20 7c 20 7a 5b 33 5d 3b 0a [2]<<8) | z[3];.
1680: 20 20 7d 0a 20 20 72 65 74 75 72 6e 20 73 75 6d }. return sum
1690: 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 4d 61 78 69 6d ;.}../*.** Maxim
16a0: 75 6d 20 6e 75 6d 62 65 72 20 6f 66 20 6c 61 6e um number of lan
16b0: 64 6d 61 72 6b 73 20 74 6f 20 73 65 74 20 69 6e dmarks to set in
16c0: 20 74 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65 the source file
16d0: 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 4d 58 5f ..*/.#define MX_
16e0: 4c 41 4e 44 4d 41 52 4b 20 28 31 30 32 34 2a 31 LANDMARK (1024*1
16f0: 32 38 29 0a 0a 2f 2a 0a 2a 2a 20 43 72 65 61 74 28)../*.** Creat
1700: 65 20 61 20 6e 65 77 20 64 65 6c 74 61 2e 0a 2a e a new delta..*
1710: 2a 0a 2a 2a 20 54 68 65 20 64 65 6c 74 61 20 69 *.** The delta i
1720: 73 20 77 72 69 74 74 65 6e 20 69 6e 74 6f 20 61 s written into a
1730: 20 70 72 65 61 6c 6c 6f 63 61 74 65 64 20 62 75 preallocated bu
1740: 66 66 65 72 2c 20 7a 44 65 6c 74 61 2c 20 77 68 ffer, zDelta, wh
1750: 69 63 68 20 0a 2a 2a 20 73 68 6f 75 6c 64 20 62 ich .** should b
1760: 65 20 61 74 20 6c 65 61 73 74 20 36 30 20 62 79 e at least 60 by
1770: 74 65 73 20 6c 6f 6e 67 65 72 20 74 68 61 6e 20 tes longer than
1780: 74 68 65 20 74 61 72 67 65 74 20 66 69 6c 65 2c the target file,
1790: 20 7a 4f 75 74 2e 0a 2a 2a 20 54 68 65 20 64 65 zOut..** The de
17a0: 6c 74 61 20 73 74 72 69 6e 67 20 77 69 6c 6c 20 lta string will
17b0: 62 65 20 4e 55 4c 2d 74 65 72 6d 69 6e 61 74 65 be NUL-terminate
17c0: 64 2c 20 62 75 74 20 69 74 20 6d 69 67 68 74 20 d, but it might
17d0: 61 6c 73 6f 20 63 6f 6e 74 61 69 6e 0a 2a 2a 20 also contain.**
17e0: 65 6d 62 65 64 64 65 64 20 4e 55 4c 20 63 68 61 embedded NUL cha
17f0: 72 61 63 74 65 72 73 20 69 66 20 65 69 74 68 65 racters if eithe
1800: 72 20 74 68 65 20 7a 53 72 63 20 6f 72 20 7a 4f r the zSrc or zO
1810: 75 74 20 66 69 6c 65 73 20 61 72 65 0a 2a 2a 20 ut files are.**
1820: 62 69 6e 61 72 79 2e 20 20 54 68 69 73 20 66 75 binary. This fu
1830: 6e 63 74 69 6f 6e 20 72 65 74 75 72 6e 73 20 74 nction returns t
1840: 68 65 20 6c 65 6e 67 74 68 20 6f 66 20 74 68 65 he length of the
1850: 20 64 65 6c 74 61 20 73 74 72 69 6e 67 0a 2a 2a delta string.**
1860: 20 69 6e 20 62 79 74 65 73 2c 20 65 78 63 6c 75 in bytes, exclu
1870: 64 69 6e 67 20 74 68 65 20 66 69 6e 61 6c 20 4e ding the final N
1880: 55 4c 20 74 65 72 6d 69 6e 61 74 6f 72 20 63 68 UL terminator ch
1890: 61 72 61 63 74 65 72 2e 0a 2a 2a 0a 2a 2a 20 4f aracter..**.** O
18a0: 75 74 70 75 74 20 46 6f 72 6d 61 74 3a 0a 2a 2a utput Format:.**
18b0: 0a 2a 2a 20 54 68 65 20 64 65 6c 74 61 20 62 65 .** The delta be
18c0: 67 69 6e 73 20 77 69 74 68 20 61 20 62 61 73 65 gins with a base
18d0: 36 34 20 6e 75 6d 62 65 72 20 66 6f 6c 6c 6f 77 64 number follow
18e0: 65 64 20 62 79 20 61 20 6e 65 77 6c 69 6e 65 2e ed by a newline.
18f0: 20 20 54 68 69 73 0a 2a 2a 20 6e 75 6d 62 65 72 This.** number
1900: 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72 20 6f is the number o
1910: 66 20 62 79 74 65 73 20 69 6e 20 74 68 65 20 54 f bytes in the T
1920: 41 52 47 45 54 20 66 69 6c 65 2e 20 20 54 68 75 ARGET file. Thu
1930: 73 2c 20 67 69 76 65 6e 20 61 0a 2a 2a 20 64 65 s, given a.** de
1940: 6c 74 61 20 66 69 6c 65 20 7a 2c 20 61 20 70 72 lta file z, a pr
1950: 6f 67 72 61 6d 20 63 61 6e 20 63 6f 6d 70 75 74 ogram can comput
1960: 65 20 74 68 65 20 73 69 7a 65 20 6f 66 20 74 68 e the size of th
1970: 65 20 6f 75 74 70 75 74 20 66 69 6c 65 0a 2a 2a e output file.**
1980: 20 73 69 6d 70 6c 79 20 62 79 20 63 61 6c 6c 69 simply by calli
1990: 6e 67 20 72 65 61 64 69 6e 67 20 74 68 65 20 66 ng reading the f
19a0: 69 72 73 74 20 6c 69 6e 65 20 61 6e 64 20 64 65 irst line and de
19b0: 63 6f 64 69 6e 67 20 74 68 65 20 62 61 73 65 2d coding the base-
19c0: 36 34 0a 2a 2a 20 6e 75 6d 62 65 72 20 66 6f 75 64.** number fou
19d0: 6e 64 20 74 68 65 72 65 2e 20 20 54 68 65 20 64 nd there. The d
19e0: 65 6c 74 61 5f 6f 75 74 70 75 74 5f 73 69 7a 65 elta_output_size
19f0: 28 29 20 72 6f 75 74 69 6e 65 20 64 6f 65 73 20 () routine does
1a00: 65 78 61 63 74 6c 79 0a 2a 2a 20 74 68 69 73 2e exactly.** this.
1a10: 0a 2a 2a 0a 2a 2a 20 41 66 74 65 72 20 74 68 65 .**.** After the
1a20: 20 69 6e 69 74 69 61 6c 20 73 69 7a 65 20 6e 75 initial size nu
1a30: 6d 62 65 72 2c 20 74 68 65 20 64 65 6c 74 61 20 mber, the delta
1a40: 63 6f 6e 73 69 73 74 73 20 6f 66 20 61 20 73 65 consists of a se
1a50: 72 69 65 73 20 6f 66 0a 2a 2a 20 6c 69 74 65 72 ries of.** liter
1a60: 61 6c 20 74 65 78 74 20 73 65 67 6d 65 6e 74 73 al text segments
1a70: 20 61 6e 64 20 63 6f 6d 6d 61 6e 64 73 20 74 6f and commands to
1a80: 20 63 6f 70 79 20 66 72 6f 6d 20 74 68 65 20 53 copy from the S
1a90: 4f 55 52 43 45 20 66 69 6c 65 2e 20 20 0a 2a 2a OURCE file. .**
1aa0: 20 41 20 63 6f 70 79 20 63 6f 6d 6d 61 6e 64 20 A copy command
1ab0: 6c 6f 6f 6b 73 20 6c 69 6b 65 20 74 68 69 73 3a looks like this:
1ac0: 0a 2a 2a 0a 2a 2a 20 20 20 20 20 4e 4e 4e 40 4d .**.** NNN@M
1ad0: 4d 4d 2c 0a 2a 2a 0a 2a 2a 20 77 68 65 72 65 20 MM,.**.** where
1ae0: 4e 4e 4e 20 69 73 20 74 68 65 20 6e 75 6d 62 65 NNN is the numbe
1af0: 72 20 6f 66 20 62 79 74 65 73 20 74 6f 20 62 65 r of bytes to be
1b00: 20 63 6f 70 69 65 64 20 61 6e 64 20 4d 4d 4d 20 copied and MMM
1b10: 69 73 20 74 68 65 20 6f 66 66 73 65 74 0a 2a 2a is the offset.**
1b20: 20 69 6e 74 6f 20 74 68 65 20 73 6f 75 72 63 65 into the source
1b30: 20 66 69 6c 65 20 6f 66 20 74 68 65 20 66 69 72 file of the fir
1b40: 73 74 20 62 79 74 65 20 28 62 6f 74 68 20 62 61 st byte (both ba
1b50: 73 65 2d 36 34 29 2e 20 20 20 49 66 20 4e 4e 4e se-64). If NNN
1b60: 20 69 73 20 30 0a 2a 2a 20 69 74 20 6d 65 61 6e is 0.** it mean
1b70: 73 20 63 6f 70 79 20 74 68 65 20 72 65 73 74 20 s copy the rest
1b80: 6f 66 20 74 68 65 20 69 6e 70 75 74 20 66 69 6c of the input fil
1b90: 65 2e 20 20 4c 69 74 65 72 61 6c 20 74 65 78 74 e. Literal text
1ba0: 20 69 73 20 6c 69 6b 65 20 74 68 69 73 3a 0a 2a is like this:.*
1bb0: 2a 0a 2a 2a 20 20 20 20 20 4e 4e 4e 3a 54 54 54 *.** NNN:TTT
1bc0: 54 54 0a 2a 2a 0a 2a 2a 20 77 68 65 72 65 20 4e TT.**.** where N
1bd0: 4e 4e 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72 NN is the number
1be0: 20 6f 66 20 62 79 74 65 73 20 6f 66 20 74 65 78 of bytes of tex
1bf0: 74 20 28 62 61 73 65 2d 36 34 29 20 61 6e 64 20 t (base-64) and
1c00: 54 54 54 54 54 20 69 73 20 74 68 65 20 74 65 78 TTTTT is the tex
1c10: 74 2e 0a 2a 2a 0a 2a 2a 20 54 68 65 20 6c 61 73 t..**.** The las
1c20: 74 20 74 65 72 6d 20 69 73 20 6f 66 20 74 68 65 t term is of the
1c30: 20 66 6f 72 6d 0a 2a 2a 0a 2a 2a 20 20 20 20 20 form.**.**
1c40: 4e 4e 4e 3b 0a 2a 2a 0a 2a 2a 20 49 6e 20 74 68 NNN;.**.** In th
1c50: 69 73 20 63 61 73 65 2c 20 4e 4e 4e 20 69 73 20 is case, NNN is
1c60: 61 20 33 32 2d 62 69 74 20 62 69 67 65 6e 64 69 a 32-bit bigendi
1c70: 61 6e 20 63 68 65 63 6b 73 75 6d 20 6f 66 20 74 an checksum of t
1c80: 68 65 20 6f 75 74 70 75 74 20 66 69 6c 65 0a 2a he output file.*
1c90: 2a 20 74 68 61 74 20 63 61 6e 20 62 65 20 75 73 * that can be us
1ca0: 65 64 20 74 6f 20 76 65 72 69 66 79 20 74 68 61 ed to verify tha
1cb0: 74 20 74 68 65 20 64 65 6c 74 61 20 61 70 70 6c t the delta appl
1cc0: 69 65 64 20 63 6f 72 72 65 63 74 6c 79 2e 20 20 ied correctly.
1cd0: 41 6c 6c 0a 2a 2a 20 6e 75 6d 62 65 72 73 20 61 All.** numbers a
1ce0: 72 65 20 69 6e 20 62 61 73 65 2d 36 34 2e 0a 2a re in base-64..*
1cf0: 2a 0a 2a 2a 20 50 75 72 65 20 74 65 78 74 20 66 *.** Pure text f
1d00: 69 6c 65 73 20 67 65 6e 65 72 61 74 65 20 61 20 iles generate a
1d10: 70 75 72 65 20 74 65 78 74 20 64 65 6c 74 61 2e pure text delta.
1d20: 20 20 42 69 6e 61 72 79 20 66 69 6c 65 73 20 67 Binary files g
1d30: 65 6e 65 72 61 74 65 20 61 0a 2a 2a 20 64 65 6c enerate a.** del
1d40: 74 61 20 74 68 61 74 20 6d 61 79 20 63 6f 6e 74 ta that may cont
1d50: 61 69 6e 20 73 6f 6d 65 20 62 69 6e 61 72 79 20 ain some binary
1d60: 64 61 74 61 2e 0a 2a 2a 0a 2a 2a 20 41 6c 67 6f data..**.** Algo
1d70: 72 69 74 68 6d 3a 0a 2a 2a 0a 2a 2a 20 54 68 65 rithm:.**.** The
1d80: 20 65 6e 63 6f 64 65 72 20 66 69 72 73 74 20 62 encoder first b
1d90: 75 69 6c 64 73 20 61 20 68 61 73 68 20 74 61 62 uilds a hash tab
1da0: 6c 65 20 74 6f 20 68 65 6c 70 20 69 74 20 66 69 le to help it fi
1db0: 6e 64 20 6d 61 74 63 68 69 6e 67 0a 2a 2a 20 70 nd matching.** p
1dc0: 61 74 74 65 72 6e 73 20 69 6e 20 74 68 65 20 73 atterns in the s
1dd0: 6f 75 72 63 65 20 66 69 6c 65 2e 20 20 31 36 2d ource file. 16-
1de0: 62 79 74 65 20 63 68 75 63 6b 73 20 6f 66 20 74 byte chucks of t
1df0: 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65 0a 2a he source file.*
1e00: 2a 20 73 61 6d 70 6c 65 64 20 61 74 20 65 76 65 * sampled at eve
1e10: 6e 6c 79 20 73 70 61 63 65 64 20 69 6e 74 65 72 nly spaced inter
1e20: 76 61 6c 73 20 61 72 65 20 75 73 65 64 20 74 6f vals are used to
1e30: 20 70 6f 70 75 6c 61 74 65 20 74 68 65 20 68 61 populate the ha
1e40: 73 68 0a 2a 2a 20 74 61 62 6c 65 2e 0a 2a 2a 0a sh.** table..**.
1e50: 2a 2a 20 4e 65 78 74 20 77 65 20 62 65 67 69 6e ** Next we begin
1e60: 20 73 63 61 6e 6e 69 6e 67 20 74 68 65 20 74 61 scanning the ta
1e70: 72 67 65 74 20 66 69 6c 65 20 75 73 69 6e 67 20 rget file using
1e80: 61 20 73 6c 69 64 69 6e 67 20 31 36 2d 62 79 74 a sliding 16-byt
1e90: 65 0a 2a 2a 20 77 69 6e 64 6f 77 2e 20 20 54 68 e.** window. Th
1ea0: 65 20 68 61 73 68 20 6f 66 20 74 68 65 20 31 36 e hash of the 16
1eb0: 2d 62 79 74 65 20 77 69 6e 64 6f 77 20 69 6e 20 -byte window in
1ec0: 74 68 65 20 74 61 72 67 65 74 20 69 73 20 75 73 the target is us
1ed0: 65 64 20 74 6f 0a 2a 2a 20 73 65 61 72 63 68 20 ed to.** search
1ee0: 66 6f 72 20 61 20 6d 61 74 63 68 69 6e 67 20 73 for a matching s
1ef0: 65 63 74 69 6f 6e 20 69 6e 20 74 68 65 20 73 6f ection in the so
1f00: 75 72 63 65 20 66 69 6c 65 2e 20 20 57 68 65 6e urce file. When
1f10: 20 61 20 6d 61 74 63 68 0a 2a 2a 20 69 73 20 66 a match.** is f
1f20: 6f 75 6e 64 2c 20 61 20 63 6f 70 79 20 63 6f 6d ound, a copy com
1f30: 6d 61 6e 64 20 69 73 20 61 64 64 65 64 20 74 6f mand is added to
1f40: 20 74 68 65 20 64 65 6c 74 61 2e 20 20 41 6e 20 the delta. An
1f50: 65 66 66 6f 72 74 20 69 73 0a 2a 2a 20 6d 61 64 effort is.** mad
1f60: 65 20 74 6f 20 65 78 74 65 6e 64 20 74 68 65 20 e to extend the
1f70: 6d 61 74 63 68 69 6e 67 20 73 65 63 74 69 6f 6e matching section
1f80: 20 74 6f 20 72 65 67 69 6f 6e 73 20 74 68 61 74 to regions that
1f90: 20 63 6f 6d 65 20 62 65 66 6f 72 65 0a 2a 2a 20 come before.**
1fa0: 61 6e 64 20 61 66 74 65 72 20 74 68 65 20 31 36 and after the 16
1fb0: 2d 62 79 74 65 20 68 61 73 68 20 77 69 6e 64 6f -byte hash windo
1fc0: 77 2e 20 20 41 20 63 6f 70 79 20 63 6f 6d 6d 61 w. A copy comma
1fd0: 6e 64 20 69 73 20 6f 6e 6c 79 20 69 73 73 75 65 nd is only issue
1fe0: 64 0a 2a 2a 20 69 66 20 74 68 65 20 72 65 73 75 d.** if the resu
1ff0: 6c 74 20 77 6f 75 6c 64 20 75 73 65 20 6c 65 73 lt would use les
2000: 73 20 73 70 61 63 65 20 74 68 61 74 20 6a 75 73 s space that jus
2010: 74 20 71 75 6f 74 69 6e 67 20 74 68 65 20 74 65 t quoting the te
2020: 78 74 0a 2a 2a 20 6c 69 74 65 72 61 6c 6c 79 2e xt.** literally.
2030: 20 4c 69 74 65 72 61 6c 20 74 65 78 74 20 69 73 Literal text is
2040: 20 61 64 64 65 64 20 74 6f 20 74 68 65 20 64 65 added to the de
2050: 6c 74 61 20 66 6f 72 20 73 65 63 74 69 6f 6e 73 lta for sections
2060: 20 74 68 61 74 20 0a 2a 2a 20 64 6f 20 6e 6f 74 that .** do not
2070: 20 6d 61 74 63 68 20 6f 72 20 77 68 69 63 68 20 match or which
2080: 63 61 6e 20 6e 6f 74 20 62 65 20 65 6e 63 6f 64 can not be encod
2090: 65 64 20 65 66 66 69 63 69 65 6e 74 6c 79 20 75 ed efficiently u
20a0: 73 69 6e 67 20 63 6f 70 79 0a 2a 2a 20 63 6f 6d sing copy.** com
20b0: 6d 61 6e 64 73 2e 0a 2a 2f 0a 69 6e 74 20 64 65 mands..*/.int de
20c0: 6c 74 61 5f 63 72 65 61 74 65 28 0a 20 20 63 6f lta_create(. co
20d0: 6e 73 74 20 63 68 61 72 20 2a 7a 53 72 63 2c 20 nst char *zSrc,
20e0: 20 20 20 20 20 2f 2a 20 54 68 65 20 73 6f 75 72 /* The sour
20f0: 63 65 20 6f 72 20 70 61 74 74 65 72 6e 20 66 69 ce or pattern fi
2100: 6c 65 20 2a 2f 0a 20 20 75 6e 73 69 67 6e 65 64 le */. unsigned
2110: 20 69 6e 74 20 6c 65 6e 53 72 63 2c 20 20 20 2f int lenSrc, /
2120: 2a 20 4c 65 6e 67 74 68 20 6f 66 20 74 68 65 20 * Length of the
2130: 73 6f 75 72 63 65 20 66 69 6c 65 20 2a 2f 0a 20 source file */.
2140: 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 4f 75 const char *zOu
2150: 74 2c 20 20 20 20 20 20 2f 2a 20 54 68 65 20 74 t, /* The t
2160: 61 72 67 65 74 20 66 69 6c 65 20 2a 2f 0a 20 20 arget file */.
2170: 75 6e 73 69 67 6e 65 64 20 69 6e 74 20 6c 65 6e unsigned int len
2180: 4f 75 74 2c 20 20 20 2f 2a 20 4c 65 6e 67 74 68 Out, /* Length
2190: 20 6f 66 20 74 68 65 20 74 61 72 67 65 74 20 66 of the target f
21a0: 69 6c 65 20 2a 2f 0a 20 20 63 68 61 72 20 2a 7a ile */. char *z
21b0: 44 65 6c 74 61 20 20 20 20 20 20 20 20 20 20 20 Delta
21c0: 2f 2a 20 57 72 69 74 65 20 74 68 65 20 64 65 6c /* Write the del
21d0: 74 61 20 69 6e 74 6f 20 74 68 69 73 20 62 75 66 ta into this buf
21e0: 66 65 72 20 2a 2f 0a 29 7b 0a 20 20 69 6e 74 20 fer */.){. int
21f0: 69 2c 20 62 61 73 65 3b 0a 20 20 63 68 61 72 20 i, base;. char
2200: 2a 7a 4f 72 69 67 44 65 6c 74 61 20 3d 20 7a 44 *zOrigDelta = zD
2210: 65 6c 74 61 3b 0a 20 20 68 61 73 68 20 68 3b 0a elta;. hash h;.
2220: 20 20 69 6e 74 20 2a 63 6f 6c 6c 69 64 65 3b 0a int *collide;.
2230: 20 20 69 6e 74 20 6c 61 73 74 52 65 61 64 20 3d int lastRead =
2240: 20 2d 31 3b 20 20 20 20 20 20 20 20 20 2f 2a 20 -1; /*
2250: 4c 61 73 74 20 62 79 74 65 20 6f 66 20 7a 53 72 Last byte of zSr
2260: 63 20 72 65 61 64 20 62 79 20 61 20 43 4f 50 59 c read by a COPY
2270: 20 63 6f 6d 6d 61 6e 64 20 2a 2f 0a 20 20 69 6e command */. in
2280: 74 20 6c 61 6e 64 6d 61 72 6b 5b 4d 58 5f 4c 41 t landmark[MX_LA
2290: 4e 44 4d 41 52 4b 5d 3b 0a 0a 20 20 2f 2a 20 41 NDMARK];.. /* A
22a0: 64 64 20 74 68 65 20 74 61 72 67 65 74 20 66 69 dd the target fi
22b0: 6c 65 20 73 69 7a 65 20 74 6f 20 74 68 65 20 62 le size to the b
22c0: 65 67 69 6e 6e 69 6e 67 20 6f 66 20 74 68 65 20 eginning of the
22d0: 64 65 6c 74 61 0a 20 20 2a 2f 0a 20 20 70 75 74 delta. */. put
22e0: 49 6e 74 28 6c 65 6e 4f 75 74 2c 20 26 7a 44 65 Int(lenOut, &zDe
22f0: 6c 74 61 29 3b 0a 20 20 2a 28 7a 44 65 6c 74 61 lta);. *(zDelta
2300: 2b 2b 29 20 3d 20 27 5c 6e 27 3b 0a 0a 20 20 2f ++) = '\n';.. /
2310: 2a 20 49 66 20 74 68 65 20 73 6f 75 72 63 65 20 * If the source
2320: 66 69 6c 65 20 69 73 20 76 65 72 79 20 73 6d 61 file is very sma
2330: 6c 6c 2c 20 69 74 20 6d 65 61 6e 73 20 74 68 61 ll, it means tha
2340: 74 20 77 65 20 68 61 76 65 20 6e 6f 0a 20 20 2a t we have no. *
2350: 2a 20 63 68 61 6e 63 65 20 6f 66 20 65 76 65 72 * chance of ever
2360: 20 64 6f 69 6e 67 20 61 20 63 6f 70 79 20 63 6f doing a copy co
2370: 6d 6d 61 6e 64 2e 20 20 4a 75 73 74 20 6f 75 74 mmand. Just out
2380: 70 75 74 20 61 20 73 69 6e 67 6c 65 0a 20 20 2a put a single. *
2390: 2a 20 6c 69 74 65 72 61 6c 20 73 65 67 6d 65 6e * literal segmen
23a0: 74 20 66 6f 72 20 74 68 65 20 65 6e 74 69 72 65 t for the entire
23b0: 20 74 61 72 67 65 74 20 61 6e 64 20 65 78 69 74 target and exit
23c0: 2e 0a 20 20 2a 2f 0a 20 20 69 66 28 20 6c 65 6e .. */. if( len
23d0: 53 72 63 3c 3d 4e 48 41 53 48 20 29 7b 0a 20 20 Src<=NHASH ){.
23e0: 20 20 70 75 74 49 6e 74 28 6c 65 6e 4f 75 74 2c putInt(lenOut,
23f0: 20 26 7a 44 65 6c 74 61 29 3b 0a 20 20 20 20 2a &zDelta);. *
2400: 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 3a 27 (zDelta++) = ':'
2410: 3b 0a 20 20 20 20 6d 65 6d 63 70 79 28 7a 44 65 ;. memcpy(zDe
2420: 6c 74 61 2c 20 7a 4f 75 74 2c 20 6c 65 6e 4f 75 lta, zOut, lenOu
2430: 74 29 3b 0a 20 20 20 20 7a 44 65 6c 74 61 20 2b t);. zDelta +
2440: 3d 20 6c 65 6e 4f 75 74 3b 0a 20 20 20 20 70 75 = lenOut;. pu
2450: 74 49 6e 74 28 63 68 65 63 6b 73 75 6d 28 7a 4f tInt(checksum(zO
2460: 75 74 2c 20 6c 65 6e 4f 75 74 29 2c 20 26 7a 44 ut, lenOut), &zD
2470: 65 6c 74 61 29 3b 0a 20 20 20 20 2a 28 7a 44 65 elta);. *(zDe
2480: 6c 74 61 2b 2b 29 20 3d 20 27 3b 27 3b 0a 20 20 lta++) = ';';.
2490: 20 20 72 65 74 75 72 6e 20 7a 44 65 6c 74 61 20 return zDelta
24a0: 2d 20 7a 4f 72 69 67 44 65 6c 74 61 3b 0a 20 20 - zOrigDelta;.
24b0: 7d 0a 0a 20 20 2f 2a 20 43 6f 6d 70 75 74 65 20 }.. /* Compute
24c0: 74 68 65 20 68 61 73 68 20 74 61 62 6c 65 20 75 the hash table u
24d0: 73 65 64 20 74 6f 20 6c 6f 63 61 74 65 20 6d 61 sed to locate ma
24e0: 74 63 68 69 6e 67 20 73 65 63 74 69 6f 6e 73 20 tching sections
24f0: 69 6e 20 74 68 65 0a 20 20 2a 2a 20 73 6f 75 72 in the. ** sour
2500: 63 65 20 66 69 6c 65 2e 0a 20 20 2a 2f 0a 20 20 ce file.. */.
2510: 63 6f 6c 6c 69 64 65 20 3d 20 6d 61 6c 6c 6f 63 collide = malloc
2520: 28 20 6c 65 6e 53 72 63 2a 73 69 7a 65 6f 66 28 ( lenSrc*sizeof(
2530: 69 6e 74 29 2f 4e 48 41 53 48 20 29 3b 0a 20 20 int)/NHASH );.
2540: 69 66 28 20 63 6f 6c 6c 69 64 65 3d 3d 30 20 29 if( collide==0 )
2550: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 6d 65 return -1;. me
2560: 6d 73 65 74 28 6c 61 6e 64 6d 61 72 6b 2c 20 2d mset(landmark, -
2570: 31 2c 20 73 69 7a 65 6f 66 28 6c 61 6e 64 6d 61 1, sizeof(landma
2580: 72 6b 29 29 3b 0a 20 20 6d 65 6d 73 65 74 28 63 rk));. memset(c
2590: 6f 6c 6c 69 64 65 2c 20 2d 31 2c 20 6c 65 6e 53 ollide, -1, lenS
25a0: 72 63 2a 73 69 7a 65 6f 66 28 69 6e 74 29 2f 4e rc*sizeof(int)/N
25b0: 48 41 53 48 20 29 3b 0a 20 20 66 6f 72 28 69 3d HASH );. for(i=
25c0: 30 3b 20 69 3c 6c 65 6e 53 72 63 2d 4e 48 41 53 0; i<lenSrc-NHAS
25d0: 48 3b 20 69 2b 3d 4e 48 41 53 48 29 7b 0a 20 20 H; i+=NHASH){.
25e0: 20 20 69 6e 74 20 68 76 3b 0a 20 20 20 20 68 61 int hv;. ha
25f0: 73 68 5f 69 6e 69 74 28 26 68 2c 20 26 7a 53 72 sh_init(&h, &zSr
2600: 63 5b 69 5d 29 3b 0a 20 20 20 20 68 76 20 3d 20 c[i]);. hv =
2610: 68 61 73 68 5f 33 32 62 69 74 28 26 68 29 20 26 hash_32bit(&h) &
2620: 20 28 4d 58 5f 4c 41 4e 44 4d 41 52 4b 2d 31 29 (MX_LANDMARK-1)
2630: 3b 0a 20 20 20 20 63 6f 6c 6c 69 64 65 5b 69 2f ;. collide[i/
2640: 4e 48 41 53 48 5d 20 3d 20 6c 61 6e 64 6d 61 72 NHASH] = landmar
2650: 6b 5b 68 76 5d 3b 0a 20 20 20 20 6c 61 6e 64 6d k[hv];. landm
2660: 61 72 6b 5b 68 76 5d 20 3d 20 69 2f 4e 48 41 53 ark[hv] = i/NHAS
2670: 48 3b 0a 20 20 7d 0a 0a 20 20 2f 2a 20 42 65 67 H;. }.. /* Beg
2680: 69 6e 20 73 63 61 6e 6e 69 6e 67 20 74 68 65 20 in scanning the
2690: 74 61 72 67 65 74 20 66 69 6c 65 20 61 6e 64 20 target file and
26a0: 67 65 6e 65 72 61 74 69 6e 67 20 63 6f 70 79 20 generating copy
26b0: 63 6f 6d 6d 61 6e 64 73 20 61 6e 64 0a 20 20 2a commands and. *
26c0: 2a 20 6c 69 74 65 72 61 6c 20 73 65 63 74 69 6f * literal sectio
26d0: 6e 73 20 6f 66 20 74 68 65 20 64 65 6c 74 61 2e ns of the delta.
26e0: 0a 20 20 2a 2f 0a 20 20 62 61 73 65 20 3d 20 30 . */. base = 0
26f0: 3b 20 20 20 20 2f 2a 20 57 65 20 68 61 76 65 20 ; /* We have
2700: 61 6c 72 65 61 64 79 20 67 65 6e 65 72 61 74 65 already generate
2710: 64 20 65 76 65 72 79 74 68 69 6e 67 20 62 65 66 d everything bef
2720: 6f 72 65 20 7a 4f 75 74 5b 62 61 73 65 5d 20 2a ore zOut[base] *
2730: 2f 0a 20 20 77 68 69 6c 65 28 20 62 61 73 65 3c /. while( base<
2740: 6c 65 6e 4f 75 74 2d 4e 48 41 53 48 20 29 7b 0a lenOut-NHASH ){.
2750: 20 20 20 20 69 6e 74 20 69 53 72 63 2c 20 69 42 int iSrc, iB
2760: 6c 6f 63 6b 3b 0a 20 20 20 20 75 6e 73 69 67 6e lock;. unsign
2770: 65 64 20 69 6e 74 20 62 65 73 74 43 6e 74 2c 20 ed int bestCnt,
2780: 62 65 73 74 4f 66 73 74 2c 20 62 65 73 74 4c 69 bestOfst, bestLi
2790: 74 73 7a 3b 0a 20 20 20 20 68 61 73 68 5f 69 6e tsz;. hash_in
27a0: 69 74 28 26 68 2c 20 26 7a 4f 75 74 5b 62 61 73 it(&h, &zOut[bas
27b0: 65 5d 29 3b 0a 20 20 20 20 69 20 3d 20 30 3b 20 e]);. i = 0;
27c0: 20 20 20 20 2f 2a 20 54 72 79 69 6e 67 20 74 6f /* Trying to
27d0: 20 6d 61 74 63 68 20 61 20 6c 61 6e 64 6d 61 72 match a landmar
27e0: 6b 20 61 67 61 69 6e 73 74 20 7a 4f 75 74 5b 62 k against zOut[b
27f0: 61 73 65 2b 69 5d 20 2a 2f 0a 20 20 20 20 62 65 ase+i] */. be
2800: 73 74 43 6e 74 20 3d 20 30 3b 0a 20 20 20 20 77 stCnt = 0;. w
2810: 68 69 6c 65 28 20 31 20 29 7b 0a 20 20 20 20 20 hile( 1 ){.
2820: 20 69 6e 74 20 68 76 3b 0a 0a 20 20 20 20 20 20 int hv;..
2830: 68 76 20 3d 20 68 61 73 68 5f 33 32 62 69 74 28 hv = hash_32bit(
2840: 26 68 29 20 26 20 28 4d 58 5f 4c 41 4e 44 4d 41 &h) & (MX_LANDMA
2850: 52 4b 2d 31 29 3b 0a 20 20 20 20 20 20 44 45 42 RK-1);. DEB
2860: 55 47 32 28 20 70 72 69 6e 74 66 28 22 4c 4f 4f UG2( printf("LOO
2870: 4b 49 4e 47 3a 20 25 34 64 20 5b 25 73 5d 5c 6e KING: %4d [%s]\n
2880: 22 2c 20 62 61 73 65 2b 69 2c 20 70 72 69 6e 74 ", base+i, print
2890: 31 36 28 26 7a 4f 75 74 5b 62 61 73 65 2b 69 5d 16(&zOut[base+i]
28a0: 29 29 3b 20 29 0a 20 20 20 20 20 20 69 42 6c 6f )); ). iBlo
28b0: 63 6b 20 3d 20 6c 61 6e 64 6d 61 72 6b 5b 68 76 ck = landmark[hv
28c0: 5d 3b 0a 20 20 20 20 20 20 77 68 69 6c 65 28 20 ];. while(
28d0: 69 42 6c 6f 63 6b 3e 3d 30 20 29 7b 0a 20 20 20 iBlock>=0 ){.
28e0: 20 20 20 20 20 2f 2a 0a 20 20 20 20 20 20 20 20 /*.
28f0: 2a 2a 20 54 68 65 20 68 61 73 68 20 77 69 6e 64 ** The hash wind
2900: 6f 77 20 68 61 73 20 69 64 65 6e 74 69 66 69 65 ow has identifie
2910: 64 20 61 20 70 6f 74 65 6e 74 69 61 6c 20 6d 61 d a potential ma
2920: 74 63 68 20 61 67 61 69 6e 73 74 20 0a 20 20 20 tch against .
2930: 20 20 20 20 20 2a 2a 20 6c 61 6e 64 6d 61 72 6b ** landmark
2940: 20 62 6c 6f 63 6b 20 69 42 6c 6f 63 6b 2e 20 20 block iBlock.
2950: 42 75 74 20 77 65 20 6e 65 65 64 20 74 6f 20 69 But we need to i
2960: 6e 76 65 73 74 69 67 61 74 65 20 66 75 72 74 68 nvestigate furth
2970: 65 72 2e 0a 20 20 20 20 20 20 20 20 2a 2a 20 0a er.. ** .
2980: 20 20 20 20 20 20 20 20 2a 2a 20 4c 6f 6f 6b 20 ** Look
2990: 66 6f 72 20 61 20 72 65 67 69 6f 6e 20 69 6e 20 for a region in
29a0: 7a 4f 75 74 20 74 68 61 74 20 6d 61 74 63 68 65 zOut that matche
29b0: 73 20 7a 53 72 63 2e 20 41 6e 63 68 6f 72 20 74 s zSrc. Anchor t
29c0: 68 65 20 73 65 61 72 63 68 0a 20 20 20 20 20 20 he search.
29d0: 20 20 2a 2a 20 61 74 20 7a 53 72 63 5b 69 53 72 ** at zSrc[iSr
29e0: 63 5d 20 61 6e 64 20 7a 4f 75 74 5b 62 61 73 65 c] and zOut[base
29f0: 2b 69 5d 2e 20 20 44 6f 20 6e 6f 74 20 69 6e 63 +i]. Do not inc
2a00: 6c 75 64 65 20 61 6e 79 74 68 69 6e 67 20 70 72 lude anything pr
2a10: 69 6f 72 20 74 6f 0a 20 20 20 20 20 20 20 20 2a ior to. *
2a20: 2a 20 7a 4f 75 74 5b 62 61 73 65 5d 20 6f 72 20 * zOut[base] or
2a30: 61 66 74 65 72 20 7a 4f 75 74 5b 6f 75 74 4c 65 after zOut[outLe
2a40: 6e 5d 20 6e 6f 72 20 61 6e 79 74 68 69 6e 67 20 n] nor anything
2a50: 61 66 74 65 72 20 7a 53 72 63 5b 73 72 63 4c 65 after zSrc[srcLe
2a60: 6e 5d 2e 0a 20 20 20 20 20 20 20 20 2a 2a 0a 20 n].. **.
2a70: 20 20 20 20 20 20 20 2a 2a 20 53 65 74 20 63 6e ** Set cn
2a80: 74 20 65 71 75 61 6c 20 74 6f 20 74 68 65 20 6c t equal to the l
2a90: 65 6e 67 74 68 20 6f 66 20 74 68 65 20 6d 61 74 ength of the mat
2aa0: 63 68 20 61 6e 64 20 73 65 74 20 6f 66 73 74 20 ch and set ofst
2ab0: 73 6f 20 74 68 61 74 0a 20 20 20 20 20 20 20 20 so that.
2ac0: 2a 2a 20 7a 53 72 63 5b 6f 66 73 74 5d 20 69 73 ** zSrc[ofst] is
2ad0: 20 74 68 65 20 66 69 72 73 74 20 65 6c 65 6d 65 the first eleme
2ae0: 6e 74 20 6f 66 20 74 68 65 20 6d 61 74 63 68 2e nt of the match.
2af0: 20 20 6c 69 74 73 7a 20 69 73 20 74 68 65 20 6e litsz is the n
2b00: 75 6d 62 65 72 0a 20 20 20 20 20 20 20 20 2a 2a umber. **
2b10: 20 6f 66 20 63 68 61 72 61 63 74 65 72 73 20 62 of characters b
2b20: 65 74 77 65 65 6e 20 7a 4f 75 74 5b 62 61 73 65 etween zOut[base
2b30: 5d 20 61 6e 64 20 74 68 65 20 62 65 67 69 6e 6e ] and the beginn
2b40: 69 6e 67 20 6f 66 20 74 68 65 20 6d 61 74 63 68 ing of the match
2b50: 2e 0a 20 20 20 20 20 20 20 20 2a 2a 20 73 7a 20 .. ** sz
2b60: 77 69 6c 6c 20 62 65 20 74 68 65 20 6f 76 65 72 will be the over
2b70: 68 65 61 64 20 28 69 6e 20 62 79 74 65 73 29 20 head (in bytes)
2b80: 6e 65 65 64 65 64 20 74 6f 20 65 6e 63 6f 64 65 needed to encode
2b90: 20 74 68 65 20 63 6f 70 79 0a 20 20 20 20 20 20 the copy.
2ba0: 20 20 2a 2a 20 63 6f 6d 6d 61 6e 64 2e 20 20 4f ** command. O
2bb0: 6e 6c 79 20 67 65 6e 65 72 61 74 65 20 63 6f 70 nly generate cop
2bc0: 79 20 63 6f 6d 6d 61 6e 64 20 69 66 20 74 68 65 y command if the
2bd0: 20 6f 76 65 72 68 65 61 64 20 6f 66 20 74 68 65 overhead of the
2be0: 0a 20 20 20 20 20 20 20 20 2a 2a 20 63 6f 70 79 . ** copy
2bf0: 20 63 6f 6d 6d 61 6e 64 20 69 73 20 6c 65 73 73 command is less
2c00: 20 74 68 61 6e 20 74 68 65 20 61 6d 6f 75 6e 74 than the amount
2c10: 20 6f 66 20 6c 69 74 65 72 61 6c 20 74 65 78 74 of literal text
2c20: 20 74 6f 20 62 65 20 63 6f 70 69 65 64 2e 0a 20 to be copied..
2c30: 20 20 20 20 20 20 20 2a 2f 0a 20 20 20 20 20 20 */.
2c40: 20 20 69 6e 74 20 63 6e 74 2c 20 6f 66 73 74 2c int cnt, ofst,
2c50: 20 6c 69 74 73 7a 3b 0a 20 20 20 20 20 20 20 20 litsz;.
2c60: 69 6e 74 20 6a 2c 20 6b 2c 20 78 2c 20 79 3b 0a int j, k, x, y;.
2c70: 20 20 20 20 20 20 20 20 69 6e 74 20 73 7a 3b 0a int sz;.
2c80: 0a 20 20 20 20 20 20 20 20 2f 2a 20 42 65 67 69 . /* Begi
2c90: 6e 6e 69 6e 67 20 61 74 20 69 53 72 63 2c 20 6d nning at iSrc, m
2ca0: 61 74 63 68 20 66 6f 72 77 61 72 64 73 20 61 73 atch forwards as
2cb0: 20 66 61 72 20 61 73 20 77 65 20 63 61 6e 2e 20 far as we can.
2cc0: 20 6a 20 63 6f 75 6e 74 73 0a 20 20 20 20 20 20 j counts.
2cd0: 20 20 2a 2a 20 74 68 65 20 6e 75 6d 62 65 72 20 ** the number
2ce0: 6f 66 20 63 68 61 72 61 63 74 65 72 73 20 74 68 of characters th
2cf0: 61 74 20 6d 61 74 63 68 20 2a 2f 0a 20 20 20 20 at match */.
2d00: 20 20 20 20 69 53 72 63 20 3d 20 69 42 6c 6f 63 iSrc = iBloc
2d10: 6b 2a 4e 48 41 53 48 3b 0a 20 20 20 20 20 20 20 k*NHASH;.
2d20: 20 66 6f 72 28 6a 3d 30 2c 20 78 3d 69 53 72 63 for(j=0, x=iSrc
2d30: 2c 20 79 3d 62 61 73 65 2b 69 3b 20 78 3c 6c 65 , y=base+i; x<le
2d40: 6e 53 72 63 20 26 26 20 79 3c 6c 65 6e 4f 75 74 nSrc && y<lenOut
2d50: 3b 20 6a 2b 2b 2c 20 78 2b 2b 2c 20 79 2b 2b 29 ; j++, x++, y++)
2d60: 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 {. if(
2d70: 7a 53 72 63 5b 78 5d 21 3d 7a 4f 75 74 5b 79 5d zSrc[x]!=zOut[y]
2d80: 20 29 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 ) break;.
2d90: 20 20 7d 0a 20 20 20 20 20 20 20 20 6a 2d 2d 3b }. j--;
2da0: 0a 0a 20 20 20 20 20 20 20 20 2f 2a 20 42 65 67 .. /* Beg
2db0: 69 6e 6e 69 6e 67 20 61 74 20 69 53 72 63 2d 31 inning at iSrc-1
2dc0: 2c 20 6d 61 74 63 68 20 62 61 63 6b 77 61 72 64 , match backward
2dd0: 73 20 61 73 20 66 61 72 20 61 73 20 77 65 20 63 s as far as we c
2de0: 61 6e 2e 20 20 6b 20 63 6f 75 6e 74 73 0a 20 20 an. k counts.
2df0: 20 20 20 20 20 20 2a 2a 20 74 68 65 20 6e 75 6d ** the num
2e00: 62 65 72 20 6f 66 20 63 68 61 72 61 63 74 65 72 ber of character
2e10: 73 20 74 68 61 74 20 6d 61 74 63 68 20 2a 2f 0a s that match */.
2e20: 20 20 20 20 20 20 20 20 66 6f 72 28 6b 3d 31 3b for(k=1;
2e30: 20 6b 3c 69 53 72 63 20 26 26 20 6b 3c 3d 69 3b k<iSrc && k<=i;
2e40: 20 6b 2b 2b 29 7b 0a 20 20 20 20 20 20 20 20 20 k++){.
2e50: 20 69 66 28 20 7a 53 72 63 5b 69 53 72 63 2d 6b if( zSrc[iSrc-k
2e60: 5d 21 3d 7a 4f 75 74 5b 62 61 73 65 2b 69 2d 6b ]!=zOut[base+i-k
2e70: 5d 20 29 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 ] ) break;.
2e80: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 6b 2d 2d }. k--
2e90: 3b 0a 0a 20 20 20 20 20 20 20 20 2f 2a 20 43 6f ;.. /* Co
2ea0: 6d 70 75 74 65 20 74 68 65 20 6f 66 66 73 65 74 mpute the offset
2eb0: 20 61 6e 64 20 73 69 7a 65 20 6f 66 20 74 68 65 and size of the
2ec0: 20 6d 61 74 63 68 69 6e 67 20 72 65 67 69 6f 6e matching region
2ed0: 20 2a 2f 0a 20 20 20 20 20 20 20 20 6f 66 73 74 */. ofst
2ee0: 20 3d 20 69 53 72 63 2d 6b 3b 0a 20 20 20 20 20 = iSrc-k;.
2ef0: 20 20 20 63 6e 74 20 3d 20 6a 2b 6b 2b 31 3b 0a cnt = j+k+1;.
2f00: 20 20 20 20 20 20 20 20 6c 69 74 73 7a 20 3d 20 litsz =
2f10: 69 2d 6b 3b 20 20 2f 2a 20 4e 75 6d 62 65 72 20 i-k; /* Number
2f20: 6f 66 20 62 79 74 65 73 20 6f 66 20 6c 69 74 65 of bytes of lite
2f30: 72 61 6c 20 74 65 78 74 20 62 65 66 6f 72 65 20 ral text before
2f40: 74 68 65 20 63 6f 70 79 20 2a 2f 0a 20 20 20 20 the copy */.
2f50: 20 20 20 20 44 45 42 55 47 32 28 20 70 72 69 6e DEBUG2( prin
2f60: 74 66 28 22 4d 41 54 43 48 20 25 64 20 62 79 74 tf("MATCH %d byt
2f70: 65 73 20 61 74 20 25 64 3a 20 5b 25 73 5d 20 6c es at %d: [%s] l
2f80: 69 74 73 7a 3d 25 64 5c 6e 22 2c 0a 20 20 20 20 itsz=%d\n",.
2f90: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20
2fa0: 20 20 20 20 63 6e 74 2c 20 6f 66 73 74 2c 20 70 cnt, ofst, p
2fb0: 72 69 6e 74 31 36 28 26 7a 53 72 63 5b 6f 66 73 rint16(&zSrc[ofs
2fc0: 74 5d 29 2c 20 6c 69 74 73 7a 29 3b 20 29 0a 20 t]), litsz); ).
2fd0: 20 20 20 20 20 20 20 2f 2a 20 73 7a 20 77 69 6c /* sz wil
2fe0: 6c 20 68 6f 6c 64 20 74 68 65 20 6e 75 6d 62 65 l hold the numbe
2ff0: 72 20 6f 66 20 62 79 74 65 73 20 6e 65 65 64 65 r of bytes neede
3000: 64 20 74 6f 20 65 6e 63 6f 64 65 20 74 68 65 20 d to encode the
3010: 22 69 6e 73 65 72 74 22 0a 20 20 20 20 20 20 20 "insert".
3020: 20 2a 2a 20 63 6f 6d 6d 61 6e 64 20 61 6e 64 20 ** command and
3030: 74 68 65 20 63 6f 70 79 20 63 6f 6d 6d 61 6e 64 the copy command
3040: 2c 20 6e 6f 74 20 63 6f 75 6e 74 69 6e 67 20 74 , not counting t
3050: 68 65 20 22 69 6e 73 65 72 74 22 20 74 65 78 74 he "insert" text
3060: 20 2a 2f 0a 20 20 20 20 20 20 20 20 73 7a 20 3d */. sz =
3070: 20 64 69 67 69 74 5f 63 6f 75 6e 74 28 69 2d 6b digit_count(i-k
3080: 29 2b 64 69 67 69 74 5f 63 6f 75 6e 74 28 63 6e )+digit_count(cn
3090: 74 29 2b 64 69 67 69 74 5f 63 6f 75 6e 74 28 6f t)+digit_count(o
30a0: 66 73 74 29 2b 33 3b 0a 20 20 20 20 20 20 20 20 fst)+3;.
30b0: 69 66 28 20 63 6e 74 3e 3d 73 7a 20 26 26 20 63 if( cnt>=sz && c
30c0: 6e 74 3e 62 65 73 74 43 6e 74 20 29 7b 0a 20 20 nt>bestCnt ){.
30d0: 20 20 20 20 20 20 20 20 2f 2a 20 52 65 6d 65 6d /* Remem
30e0: 62 65 72 20 74 68 69 73 20 6d 61 74 63 68 20 6f ber this match o
30f0: 6e 6c 79 20 69 66 20 69 74 20 69 73 20 74 68 65 nly if it is the
3100: 20 62 65 73 74 20 73 6f 20 66 61 72 20 61 6e 64 best so far and
3110: 20 69 74 0a 20 20 20 20 20 20 20 20 20 20 2a 2a it. **
3120: 20 64 6f 65 73 20 6e 6f 74 20 69 6e 63 72 65 61 does not increa
3130: 73 65 20 74 68 65 20 66 69 6c 65 20 73 69 7a 65 se the file size
3140: 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 62 65 */. be
3150: 73 74 43 6e 74 20 3d 20 63 6e 74 3b 0a 20 20 20 stCnt = cnt;.
3160: 20 20 20 20 20 20 20 62 65 73 74 4f 66 73 74 20 bestOfst
3170: 3d 20 69 53 72 63 2d 6b 3b 0a 20 20 20 20 20 20 = iSrc-k;.
3180: 20 20 20 20 62 65 73 74 4c 69 74 73 7a 20 3d 20 bestLitsz =
3190: 6c 69 74 73 7a 3b 0a 20 20 20 20 20 20 20 20 20 litsz;.
31a0: 20 44 45 42 55 47 32 28 20 70 72 69 6e 74 66 28 DEBUG2( printf(
31b0: 22 2e 2e 2e 20 42 45 53 54 20 53 4f 20 46 41 52 "... BEST SO FAR
31c0: 5c 6e 22 29 3b 20 29 0a 20 20 20 20 20 20 20 20 \n"); ).
31d0: 7d 0a 0a 20 20 20 20 20 20 20 20 2f 2a 20 43 68 }.. /* Ch
31e0: 65 63 6b 20 74 68 65 20 6e 65 78 74 20 6d 61 74 eck the next mat
31f0: 63 68 69 6e 67 20 62 6c 6f 63 6b 20 2a 2f 0a 20 ching block */.
3200: 20 20 20 20 20 20 20 69 42 6c 6f 63 6b 20 3d 20 iBlock =
3210: 63 6f 6c 6c 69 64 65 5b 69 42 6c 6f 63 6b 5d 3b collide[iBlock];
3220: 0a 20 20 20 20 20 20 7d 0a 0a 20 20 20 20 20 20 . }..
3230: 2f 2a 20 57 65 20 68 61 76 65 20 61 20 63 6f 70 /* We have a cop
3240: 79 20 63 6f 6d 6d 61 6e 64 20 74 68 61 74 20 64 y command that d
3250: 6f 65 73 20 6e 6f 74 20 63 61 75 73 65 20 74 68 oes not cause th
3260: 65 20 64 65 6c 74 61 20 74 6f 20 62 65 20 6c 61 e delta to be la
3270: 72 67 65 72 0a 20 20 20 20 20 20 2a 2a 20 74 68 rger. ** th
3280: 61 6e 20 61 20 6c 69 74 65 72 61 6c 20 69 6e 73 an a literal ins
3290: 65 72 74 2e 20 20 53 6f 20 61 64 64 20 74 68 65 ert. So add the
32a0: 20 63 6f 70 79 20 63 6f 6d 6d 61 6e 64 20 74 6f copy command to
32b0: 20 74 68 65 20 64 65 6c 74 61 2e 0a 20 20 20 20 the delta..
32c0: 20 20 2a 2f 0a 20 20 20 20 20 20 69 66 28 20 62 */. if( b
32d0: 65 73 74 43 6e 74 3e 30 20 26 26 20 62 61 73 65 estCnt>0 && base
32e0: 2b 69 3e 3d 62 65 73 74 4f 66 73 74 2b 4e 48 41 +i>=bestOfst+NHA
32f0: 53 48 20 29 7b 0a 20 20 20 20 20 20 20 20 69 66 SH ){. if
3300: 28 20 62 65 73 74 4c 69 74 73 7a 3e 30 20 29 7b ( bestLitsz>0 ){
3310: 0a 20 20 20 20 20 20 20 20 20 20 2f 2a 20 41 64 . /* Ad
3320: 64 20 61 6e 20 69 6e 73 65 72 74 20 63 6f 6d 6d d an insert comm
3330: 61 6e 64 20 62 65 66 6f 72 65 20 74 68 65 20 63 and before the c
3340: 6f 70 79 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 opy */.
3350: 20 70 75 74 49 6e 74 28 62 65 73 74 4c 69 74 73 putInt(bestLits
3360: 7a 2c 26 7a 44 65 6c 74 61 29 3b 0a 20 20 20 20 z,&zDelta);.
3370: 20 20 20 20 20 20 2a 28 7a 44 65 6c 74 61 2b 2b *(zDelta++
3380: 29 20 3d 20 27 3a 27 3b 0a 20 20 20 20 20 20 20 ) = ':';.
3390: 20 20 20 6d 65 6d 63 70 79 28 7a 44 65 6c 74 61 memcpy(zDelta
33a0: 2c 20 26 7a 4f 75 74 5b 62 61 73 65 5d 2c 20 62 , &zOut[base], b
33b0: 65 73 74 4c 69 74 73 7a 29 3b 0a 20 20 20 20 20 estLitsz);.
33c0: 20 20 20 20 20 7a 44 65 6c 74 61 20 2b 3d 20 62 zDelta += b
33d0: 65 73 74 4c 69 74 73 7a 3b 0a 20 20 20 20 20 20 estLitsz;.
33e0: 20 20 20 20 62 61 73 65 20 2b 3d 20 62 65 73 74 base += best
33f0: 4c 69 74 73 7a 3b 0a 20 20 20 20 20 20 20 20 20 Litsz;.
3400: 20 44 45 42 55 47 32 28 20 70 72 69 6e 74 66 28 DEBUG2( printf(
3410: 22 69 6e 73 65 72 74 20 25 64 5c 6e 22 2c 20 62 "insert %d\n", b
3420: 65 73 74 4c 69 74 73 7a 29 3b 20 29 0a 20 20 20 estLitsz); ).
3430: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 62 }. b
3440: 61 73 65 20 2b 3d 20 62 65 73 74 43 6e 74 3b 0a ase += bestCnt;.
3450: 20 20 20 20 20 20 20 20 70 75 74 49 6e 74 28 62 putInt(b
3460: 65 73 74 43 6e 74 2c 20 26 7a 44 65 6c 74 61 29 estCnt, &zDelta)
3470: 3b 0a 20 20 20 20 20 20 20 20 2a 28 7a 44 65 6c ;. *(zDel
3480: 74 61 2b 2b 29 20 3d 20 27 40 27 3b 0a 20 20 20 ta++) = '@';.
3490: 20 20 20 20 20 70 75 74 49 6e 74 28 62 65 73 74 putInt(best
34a0: 4f 66 73 74 2c 20 26 7a 44 65 6c 74 61 29 3b 0a Ofst, &zDelta);.
34b0: 20 20 20 20 20 20 20 20 44 45 42 55 47 32 28 20 DEBUG2(
34c0: 70 72 69 6e 74 66 28 22 63 6f 70 79 20 25 64 20 printf("copy %d
34d0: 62 79 74 65 73 20 66 72 6f 6d 20 25 64 5c 6e 22 bytes from %d\n"
34e0: 2c 20 62 65 73 74 43 6e 74 2c 20 62 65 73 74 4f , bestCnt, bestO
34f0: 66 73 74 29 3b 20 29 0a 20 20 20 20 20 20 20 20 fst); ).
3500: 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 2c *(zDelta++) = ',
3510: 27 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 62 ';. if( b
3520: 65 73 74 4f 66 73 74 20 2b 20 62 65 73 74 43 6e estOfst + bestCn
3530: 74 20 2d 31 20 3e 20 6c 61 73 74 52 65 61 64 20 t -1 > lastRead
3540: 29 7b 0a 20 20 20 20 20 20 20 20 20 20 6c 61 73 ){. las
3550: 74 52 65 61 64 20 3d 20 62 65 73 74 4f 66 73 74 tRead = bestOfst
3560: 20 2b 20 62 65 73 74 43 6e 74 20 2d 20 31 3b 0a + bestCnt - 1;.
3570: 20 20 20 20 20 20 20 20 20 20 44 45 42 55 47 32 DEBUG2
3580: 28 20 70 72 69 6e 74 66 28 22 6c 61 73 74 52 65 ( printf("lastRe
3590: 61 64 20 62 65 63 6f 6d 65 73 20 25 64 5c 6e 22 ad becomes %d\n"
35a0: 2c 20 6c 61 73 74 52 65 61 64 29 3b 20 29 0a 20 , lastRead); ).
35b0: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 }.
35c0: 20 62 65 73 74 43 6e 74 20 3d 20 30 3b 0a 20 20 bestCnt = 0;.
35d0: 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 break;.
35e0: 20 20 20 7d 0a 0a 20 20 20 20 20 20 2f 2a 20 49 }.. /* I
35f0: 66 20 77 65 20 72 65 61 63 68 20 74 68 69 73 20 f we reach this
3600: 70 6f 69 6e 74 2c 20 69 74 20 6d 65 61 6e 73 20 point, it means
3610: 6e 6f 20 6d 61 74 63 68 20 69 73 20 66 6f 75 6e no match is foun
3620: 64 20 73 6f 20 66 61 72 20 2a 2f 0a 20 20 20 20 d so far */.
3630: 20 20 69 66 28 20 62 61 73 65 2b 69 2b 4e 48 41 if( base+i+NHA
3640: 53 48 3e 6c 65 6e 4f 75 74 20 29 7b 0a 20 20 20 SH>lenOut ){.
3650: 20 20 20 20 20 2f 2a 20 57 65 20 68 61 76 65 20 /* We have
3660: 72 65 61 63 68 65 64 20 74 68 65 20 65 6e 64 20 reached the end
3670: 6f 66 20 74 68 65 20 66 69 6c 65 20 61 6e 64 20 of the file and
3680: 68 61 76 65 20 6e 6f 74 20 66 6f 75 6e 64 20 61 have not found a
3690: 6e 79 0a 20 20 20 20 20 20 20 20 2a 2a 20 6d 61 ny. ** ma
36a0: 74 63 68 65 73 2e 20 20 44 6f 20 61 6e 20 22 69 tches. Do an "i
36b0: 6e 73 65 72 74 22 20 66 6f 72 20 65 76 65 72 79 nsert" for every
36c0: 74 68 69 6e 67 20 74 68 61 74 20 64 6f 65 73 20 thing that does
36d0: 6e 6f 74 20 6d 61 74 63 68 20 2a 2f 0a 20 20 20 not match */.
36e0: 20 20 20 20 20 70 75 74 49 6e 74 28 6c 65 6e 4f putInt(lenO
36f0: 75 74 2d 62 61 73 65 2c 20 26 7a 44 65 6c 74 61 ut-base, &zDelta
3700: 29 3b 0a 20 20 20 20 20 20 20 20 2a 28 7a 44 65 );. *(zDe
3710: 6c 74 61 2b 2b 29 20 3d 20 27 3a 27 3b 0a 20 20 lta++) = ':';.
3720: 20 20 20 20 20 20 6d 65 6d 63 70 79 28 7a 44 65 memcpy(zDe
3730: 6c 74 61 2c 20 26 7a 4f 75 74 5b 62 61 73 65 5d lta, &zOut[base]
3740: 2c 20 6c 65 6e 4f 75 74 2d 62 61 73 65 29 3b 0a , lenOut-base);.
3750: 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 20 2b zDelta +
3760: 3d 20 6c 65 6e 4f 75 74 2d 62 61 73 65 3b 0a 20 = lenOut-base;.
3770: 20 20 20 20 20 20 20 62 61 73 65 20 3d 20 6c 65 base = le
3780: 6e 4f 75 74 3b 0a 20 20 20 20 20 20 20 20 62 72 nOut;. br
3790: 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 0a 20 20 eak;. }..
37a0: 20 20 20 20 2f 2a 20 41 64 76 61 6e 63 65 20 74 /* Advance t
37b0: 68 65 20 68 61 73 68 20 62 79 20 6f 6e 65 20 63 he hash by one c
37c0: 68 61 72 61 63 74 65 72 2e 20 20 4b 65 65 70 20 haracter. Keep
37d0: 6c 6f 6f 6b 69 6e 67 20 66 6f 72 20 61 20 6d 61 looking for a ma
37e0: 74 63 68 20 2a 2f 0a 20 20 20 20 20 20 68 61 73 tch */. has
37f0: 68 5f 6e 65 78 74 28 26 68 2c 20 7a 4f 75 74 5b h_next(&h, zOut[
3800: 62 61 73 65 2b 69 2b 4e 48 41 53 48 5d 29 3b 0a base+i+NHASH]);.
3810: 20 20 20 20 20 20 69 2b 2b 3b 0a 20 20 20 20 7d i++;. }
3820: 0a 20 20 7d 0a 20 20 2f 2a 20 4f 75 74 70 75 74 . }. /* Output
3830: 20 61 20 66 69 6e 61 6c 20 22 69 6e 73 65 72 74 a final "insert
3840: 22 20 72 65 63 6f 72 64 20 74 6f 20 67 65 74 20 " record to get
3850: 61 6c 6c 20 74 68 65 20 74 65 78 74 20 61 74 20 all the text at
3860: 74 68 65 20 65 6e 64 20 6f 66 0a 20 20 2a 2a 20 the end of. **
3870: 74 68 65 20 66 69 6c 65 20 74 68 61 74 20 64 6f the file that do
3880: 65 73 20 6e 6f 74 20 6d 61 74 63 68 20 61 6e 79 es not match any
3890: 74 68 69 6e 67 20 69 6e 20 74 68 65 20 73 6f 75 thing in the sou
38a0: 72 63 65 20 66 69 6c 65 2e 0a 20 20 2a 2f 0a 20 rce file.. */.
38b0: 20 69 66 28 20 62 61 73 65 3c 6c 65 6e 4f 75 74 if( base<lenOut
38c0: 20 29 7b 0a 20 20 20 20 70 75 74 49 6e 74 28 6c ){. putInt(l
38d0: 65 6e 4f 75 74 2d 62 61 73 65 2c 20 26 7a 44 65 enOut-base, &zDe
38e0: 6c 74 61 29 3b 0a 20 20 20 20 2a 28 7a 44 65 6c lta);. *(zDel
38f0: 74 61 2b 2b 29 20 3d 20 27 3a 27 3b 0a 20 20 20 ta++) = ':';.
3900: 20 6d 65 6d 63 70 79 28 7a 44 65 6c 74 61 2c 20 memcpy(zDelta,
3910: 26 7a 4f 75 74 5b 62 61 73 65 5d 2c 20 6c 65 6e &zOut[base], len
3920: 4f 75 74 2d 62 61 73 65 29 3b 0a 20 20 20 20 7a Out-base);. z
3930: 44 65 6c 74 61 20 2b 3d 20 6c 65 6e 4f 75 74 2d Delta += lenOut-
3940: 62 61 73 65 3b 0a 20 20 7d 0a 20 20 2f 2a 20 4f base;. }. /* O
3950: 75 74 70 75 74 20 74 68 65 20 66 69 6e 61 6c 20 utput the final
3960: 63 68 65 63 6b 73 75 6d 20 72 65 63 6f 72 64 2e checksum record.
3970: 20 2a 2f 0a 20 20 70 75 74 49 6e 74 28 63 68 65 */. putInt(che
3980: 63 6b 73 75 6d 28 7a 4f 75 74 2c 20 6c 65 6e 4f cksum(zOut, lenO
3990: 75 74 29 2c 20 26 7a 44 65 6c 74 61 29 3b 0a 20 ut), &zDelta);.
39a0: 20 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 *(zDelta++) = '
39b0: 3b 27 3b 0a 20 20 66 72 65 65 28 63 6f 6c 6c 69 ;';. free(colli
39c0: 64 65 29 3b 0a 20 20 72 65 74 75 72 6e 20 7a 44 de);. return zD
39d0: 65 6c 74 61 20 2d 20 7a 4f 72 69 67 44 65 6c 74 elta - zOrigDelt
39e0: 61 3b 20 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 52 65 74 a; .}../*.** Ret
39f0: 75 72 6e 20 74 68 65 20 73 69 7a 65 20 28 69 6e urn the size (in
3a00: 20 62 79 74 65 73 29 20 6f 66 20 74 68 65 20 6f bytes) of the o
3a10: 75 74 70 75 74 20 66 72 6f 6d 20 61 70 70 6c 79 utput from apply
3a20: 69 6e 67 0a 2a 2a 20 61 20 64 65 6c 74 61 2e 20 ing.** a delta.
3a30: 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20 72 6f 75 74 .**.** This rout
3a40: 69 6e 65 20 69 73 20 70 72 6f 76 69 64 65 64 20 ine is provided
3a50: 73 6f 20 74 68 61 74 20 61 6e 20 70 72 6f 63 65 so that an proce
3a60: 64 75 72 65 20 74 68 61 74 20 69 73 20 61 62 6c dure that is abl
3a70: 65 0a 2a 2a 20 74 6f 20 63 61 6c 6c 20 64 65 6c e.** to call del
3a80: 74 61 5f 61 70 70 6c 79 28 29 20 63 61 6e 20 6c ta_apply() can l
3a90: 65 61 72 6e 20 68 6f 77 20 6d 75 63 68 20 73 70 earn how much sp
3aa0: 61 63 65 20 69 73 20 72 65 71 75 69 72 65 64 0a ace is required.
3ab0: 2a 2a 20 66 6f 72 20 74 68 65 20 6f 75 74 70 75 ** for the outpu
3ac0: 74 20 61 6e 64 20 68 65 6e 63 65 20 61 6c 6c 6f t and hence allo
3ad0: 63 61 74 65 20 6e 6f 72 20 6d 6f 72 65 20 73 70 cate nor more sp
3ae0: 61 63 65 20 74 68 61 74 20 69 73 20 72 65 61 6c ace that is real
3af0: 6c 79 0a 2a 2a 20 6e 65 65 64 65 64 2e 0a 2a 2f ly.** needed..*/
3b00: 0a 69 6e 74 20 64 65 6c 74 61 5f 6f 75 74 70 75 .int delta_outpu
3b10: 74 5f 73 69 7a 65 28 63 6f 6e 73 74 20 63 68 61 t_size(const cha
3b20: 72 20 2a 7a 44 65 6c 74 61 2c 20 69 6e 74 20 6c r *zDelta, int l
3b30: 65 6e 44 65 6c 74 61 29 7b 0a 20 20 69 6e 74 20 enDelta){. int
3b40: 73 69 7a 65 3b 0a 20 20 73 69 7a 65 20 3d 20 67 size;. size = g
3b50: 65 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 26 etInt(&zDelta, &
3b60: 6c 65 6e 44 65 6c 74 61 29 3b 0a 20 20 69 66 28 lenDelta);. if(
3b70: 20 2a 7a 44 65 6c 74 61 21 3d 27 5c 6e 27 20 29 *zDelta!='\n' )
3b80: 7b 0a 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 {. /* ERROR:
3b90: 73 69 7a 65 20 69 6e 74 65 67 65 72 20 6e 6f 74 size integer not
3ba0: 20 74 65 72 6d 69 6e 61 74 65 64 20 62 79 20 22 terminated by "
3bb0: 5c 6e 22 20 2a 2f 0a 20 20 20 20 72 65 74 75 72 \n" */. retur
3bc0: 6e 20 2d 31 3b 0a 20 20 7d 0a 20 20 72 65 74 75 n -1;. }. retu
3bd0: 72 6e 20 73 69 7a 65 3b 0a 7d 0a 0a 0a 2f 2a 0a rn size;.}.../*.
3be0: 2a 2a 20 41 70 70 6c 79 20 61 20 64 65 6c 74 61 ** Apply a delta
3bf0: 2e 0a 2a 2a 0a 2a 2a 20 54 68 65 20 6f 75 74 70 ..**.** The outp
3c00: 75 74 20 62 75 66 66 65 72 20 73 68 6f 75 6c 64 ut buffer should
3c10: 20 62 65 20 62 69 67 20 65 6e 6f 75 67 68 20 74 be big enough t
3c20: 6f 20 68 6f 6c 64 20 74 68 65 20 77 68 6f 6c 65 o hold the whole
3c30: 20 6f 75 74 70 75 74 0a 2a 2a 20 66 69 6c 65 20 output.** file
3c40: 61 6e 64 20 61 20 4e 55 4c 20 74 65 72 6d 69 6e and a NUL termin
3c50: 61 74 6f 72 20 61 74 20 74 68 65 20 65 6e 64 2e ator at the end.
3c60: 20 20 54 68 65 20 64 65 6c 74 61 5f 6f 75 74 70 The delta_outp
3c70: 75 74 5f 73 69 7a 65 28 29 0a 2a 2a 20 72 6f 75 ut_size().** rou
3c80: 74 69 6e 65 20 77 69 6c 6c 20 64 65 74 65 72 6d tine will determ
3c90: 69 6e 65 20 74 68 69 73 20 73 69 7a 65 20 66 6f ine this size fo
3ca0: 72 20 79 6f 75 2e 0a 2a 2a 0a 2a 2a 20 54 68 65 r you..**.** The
3cb0: 20 64 65 6c 74 61 20 73 74 72 69 6e 67 20 73 68 delta string sh
3cc0: 6f 75 6c 64 20 62 65 20 6e 75 6c 6c 2d 74 65 72 ould be null-ter
3cd0: 6d 69 6e 61 74 65 64 2e 20 20 42 75 74 20 74 68 minated. But th
3ce0: 65 20 64 65 6c 74 61 20 73 74 72 69 6e 67 0a 2a e delta string.*
3cf0: 2a 20 6d 61 79 20 63 6f 6e 74 61 69 6e 20 65 6d * may contain em
3d00: 62 65 64 64 65 64 20 4e 55 4c 20 63 68 61 72 61 bedded NUL chara
3d10: 63 74 65 72 73 20 28 69 66 20 74 68 65 20 69 6e cters (if the in
3d20: 70 75 74 20 61 6e 64 20 6f 75 74 70 75 74 20 61 put and output a
3d30: 72 65 0a 2a 2a 20 62 69 6e 61 72 79 20 66 69 6c re.** binary fil
3d40: 65 73 29 20 73 6f 20 77 65 20 61 6c 73 6f 20 68 es) so we also h
3d50: 61 76 65 20 74 6f 20 70 61 73 73 20 69 6e 20 74 ave to pass in t
3d60: 68 65 20 6c 65 6e 67 74 68 20 6f 66 20 74 68 65 he length of the
3d70: 20 64 65 6c 74 61 20 69 6e 0a 2a 2a 20 74 68 65 delta in.** the
3d80: 20 6c 65 6e 44 65 6c 74 61 20 70 61 72 61 6d 65 lenDelta parame
3d90: 74 65 72 2e 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20 ter..**.** This
3da0: 66 75 6e 63 74 69 6f 6e 20 72 65 74 75 72 6e 73 function returns
3db0: 20 74 68 65 20 73 69 7a 65 20 6f 66 20 74 68 65 the size of the
3dc0: 20 6f 75 74 70 75 74 20 66 69 6c 65 20 69 6e 20 output file in
3dd0: 62 79 74 65 73 20 28 65 78 63 6c 75 64 69 6e 67 bytes (excluding
3de0: 0a 2a 2a 20 74 68 65 20 66 69 6e 61 6c 20 4e 55 .** the final NU
3df0: 4c 20 74 65 72 6d 69 6e 61 74 6f 72 20 63 68 61 L terminator cha
3e00: 72 61 63 74 65 72 29 2e 20 20 45 78 63 65 70 74 racter). Except
3e10: 2c 20 69 66 20 74 68 65 20 64 65 6c 74 61 20 73 , if the delta s
3e20: 74 72 69 6e 67 20 69 73 0a 2a 2a 20 6d 61 6c 66 tring is.** malf
3e30: 6f 72 6d 65 64 20 6f 72 20 69 6e 74 65 6e 64 65 ormed or intende
3e40: 64 20 66 6f 72 20 75 73 65 20 77 69 74 68 20 61 d for use with a
3e50: 20 73 6f 75 72 63 65 20 66 69 6c 65 20 6f 74 68 source file oth
3e60: 65 72 20 74 68 61 6e 20 7a 53 72 63 2c 0a 2a 2a er than zSrc,.**
3e70: 20 74 68 65 6e 20 74 68 69 73 20 72 6f 75 74 69 then this routi
3e80: 6e 65 20 72 65 74 75 72 6e 73 20 2d 31 2e 0a 2a ne returns -1..*
3e90: 2a 0a 2a 2a 20 52 65 66 65 72 20 74 6f 20 74 68 *.** Refer to th
3ea0: 65 20 64 65 6c 74 61 5f 63 72 65 61 74 65 28 29 e delta_create()
3eb0: 20 64 6f 63 75 6d 65 6e 74 61 74 69 6f 6e 20 61 documentation a
3ec0: 62 6f 76 65 20 66 6f 72 20 61 20 64 65 73 63 72 bove for a descr
3ed0: 69 70 74 69 6f 6e 0a 2a 2a 20 6f 66 20 74 68 65 iption.** of the
3ee0: 20 64 65 6c 74 61 20 66 69 6c 65 20 66 6f 72 6d delta file form
3ef0: 61 74 2e 0a 2a 2f 0a 69 6e 74 20 64 65 6c 74 61 at..*/.int delta
3f00: 5f 61 70 70 6c 79 28 0a 20 20 63 6f 6e 73 74 20 _apply(. const
3f10: 63 68 61 72 20 2a 7a 53 72 63 2c 20 20 20 20 20 char *zSrc,
3f20: 20 2f 2a 20 54 68 65 20 73 6f 75 72 63 65 20 6f /* The source o
3f30: 72 20 70 61 74 74 65 72 6e 20 66 69 6c 65 20 2a r pattern file *
3f40: 2f 0a 20 20 69 6e 74 20 6c 65 6e 53 72 63 2c 20 /. int lenSrc,
3f50: 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20 4c 65 /* Le
3f60: 6e 67 74 68 20 6f 66 20 74 68 65 20 73 6f 75 72 ngth of the sour
3f70: 63 65 20 66 69 6c 65 20 2a 2f 0a 20 20 63 6f 6e ce file */. con
3f80: 73 74 20 63 68 61 72 20 2a 7a 44 65 6c 74 61 2c st char *zDelta,
3f90: 20 20 20 20 2f 2a 20 44 65 6c 74 61 20 74 6f 20 /* Delta to
3fa0: 61 70 70 6c 79 20 74 6f 20 74 68 65 20 70 61 74 apply to the pat
3fb0: 74 65 72 6e 20 2a 2f 0a 20 20 69 6e 74 20 6c 65 tern */. int le
3fc0: 6e 44 65 6c 74 61 2c 20 20 20 20 20 20 20 20 20 nDelta,
3fd0: 20 2f 2a 20 4c 65 6e 67 74 68 20 6f 66 20 74 68 /* Length of th
3fe0: 65 20 64 65 6c 74 61 20 2a 2f 0a 20 20 63 68 61 e delta */. cha
3ff0: 72 20 2a 7a 4f 75 74 20 20 20 20 20 20 20 20 20 r *zOut
4000: 20 20 20 20 2f 2a 20 57 72 69 74 65 20 74 68 65 /* Write the
4010: 20 6f 75 74 70 75 74 20 69 6e 74 6f 20 74 68 69 output into thi
4020: 73 20 70 72 65 61 6c 6c 6f 63 61 74 65 64 20 62 s preallocated b
4030: 75 66 66 65 72 20 2a 2f 0a 29 7b 0a 20 20 75 6e uffer */.){. un
4040: 73 69 67 6e 65 64 20 69 6e 74 20 6c 69 6d 69 74 signed int limit
4050: 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e 74 ;. unsigned int
4060: 20 74 6f 74 61 6c 20 3d 20 30 3b 0a 20 20 63 68 total = 0;. ch
4070: 61 72 20 2a 7a 4f 72 69 67 4f 75 74 20 3d 20 7a ar *zOrigOut = z
4080: 4f 75 74 3b 0a 0a 20 20 6c 69 6d 69 74 20 3d 20 Out;.. limit =
4090: 67 65 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 getInt(&zDelta,
40a0: 26 6c 65 6e 44 65 6c 74 61 29 3b 0a 20 20 69 66 &lenDelta);. if
40b0: 28 20 2a 7a 44 65 6c 74 61 21 3d 27 5c 6e 27 20 ( *zDelta!='\n'
40c0: 29 7b 0a 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a ){. /* ERROR:
40d0: 20 73 69 7a 65 20 69 6e 74 65 67 65 72 20 6e 6f size integer no
40e0: 74 20 74 65 72 6d 69 6e 61 74 65 64 20 62 79 20 t terminated by
40f0: 22 5c 6e 22 20 2a 2f 0a 20 20 20 20 72 65 74 75 "\n" */. retu
4100: 72 6e 20 2d 31 3b 0a 20 20 7d 0a 20 20 7a 44 65 rn -1;. }. zDe
4110: 6c 74 61 2b 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d lta++; lenDelta-
4120: 2d 3b 0a 20 20 77 68 69 6c 65 28 20 2a 7a 44 65 -;. while( *zDe
4130: 6c 74 61 20 26 26 20 6c 65 6e 44 65 6c 74 61 3e lta && lenDelta>
4140: 30 20 29 7b 0a 20 20 20 20 75 6e 73 69 67 6e 65 0 ){. unsigne
4150: 64 20 69 6e 74 20 63 6e 74 2c 20 6f 66 73 74 3b d int cnt, ofst;
4160: 0a 20 20 20 20 63 6e 74 20 3d 20 67 65 74 49 6e . cnt = getIn
4170: 74 28 26 7a 44 65 6c 74 61 2c 20 26 6c 65 6e 44 t(&zDelta, &lenD
4180: 65 6c 74 61 29 3b 0a 20 20 20 20 73 77 69 74 63 elta);. switc
4190: 68 28 20 7a 44 65 6c 74 61 5b 30 5d 20 29 7b 0a h( zDelta[0] ){.
41a0: 20 20 20 20 20 20 63 61 73 65 20 27 40 27 3a 20 case '@':
41b0: 7b 0a 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 {. zDelta
41c0: 2b 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d 2d 3b 0a ++; lenDelta--;.
41d0: 20 20 20 20 20 20 20 20 6f 66 73 74 20 3d 20 67 ofst = g
41e0: 65 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 26 etInt(&zDelta, &
41f0: 6c 65 6e 44 65 6c 74 61 29 3b 0a 20 20 20 20 20 lenDelta);.
4200: 20 20 20 69 66 28 20 7a 44 65 6c 74 61 5b 30 5d if( zDelta[0]
4210: 21 3d 27 2c 27 20 29 7b 0a 20 20 20 20 20 20 20 !=',' ){.
4220: 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 63 6f 70 /* ERROR: cop
4230: 79 20 63 6f 6d 6d 61 6e 64 20 6e 6f 74 20 74 65 y command not te
4240: 72 6d 69 6e 61 74 65 64 20 62 79 20 27 2c 27 20 rminated by ','
4250: 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 72 65 74 */. ret
4260: 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 urn -1;.
4270: 7d 0a 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 }. zDelta
4280: 2b 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d 2d 3b 0a ++; lenDelta--;.
4290: 20 20 20 20 20 20 20 20 44 45 42 55 47 31 28 20 DEBUG1(
42a0: 70 72 69 6e 74 66 28 22 43 4f 50 59 20 25 64 20 printf("COPY %d
42b0: 66 72 6f 6d 20 25 64 5c 6e 22 2c 20 63 6e 74 2c from %d\n", cnt,
42c0: 20 6f 66 73 74 29 3b 20 29 0a 20 20 20 20 20 20 ofst); ).
42d0: 20 20 74 6f 74 61 6c 20 2b 3d 20 63 6e 74 3b 0a total += cnt;.
42e0: 20 20 20 20 20 20 20 20 69 66 28 20 74 6f 74 61 if( tota
42f0: 6c 3e 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20 l>limit ){.
4300: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 63 /* ERROR: c
4310: 6f 70 79 20 65 78 63 65 65 64 73 20 6f 75 74 70 opy exceeds outp
4320: 75 74 20 66 69 6c 65 20 73 69 7a 65 20 2a 2f 0a ut file size */.
4330: 20 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e return
4340: 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 -1;. }.
4350: 20 20 20 20 20 20 20 69 66 28 20 6f 66 73 74 2b if( ofst+
4360: 63 6e 74 20 3e 20 6c 65 6e 53 72 63 20 29 7b 0a cnt > lenSrc ){.
4370: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 /* ERR
4380: 4f 52 3a 20 63 6f 70 79 20 65 78 74 65 6e 64 73 OR: copy extends
4390: 20 70 61 73 74 20 65 6e 64 20 6f 66 20 69 6e 70 past end of inp
43a0: 75 74 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 ut */.
43b0: 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 return -1;.
43c0: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 6d 65 6d }. mem
43d0: 63 70 79 28 7a 4f 75 74 2c 20 26 7a 53 72 63 5b cpy(zOut, &zSrc[
43e0: 6f 66 73 74 5d 2c 20 63 6e 74 29 3b 0a 20 20 20 ofst], cnt);.
43f0: 20 20 20 20 20 7a 4f 75 74 20 2b 3d 20 63 6e 74 zOut += cnt
4400: 3b 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b ;. break;
4410: 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63 . }. c
4420: 61 73 65 20 27 3a 27 3a 20 7b 0a 20 20 20 20 20 ase ':': {.
4430: 20 20 20 7a 44 65 6c 74 61 2b 2b 3b 20 6c 65 6e zDelta++; len
4440: 44 65 6c 74 61 2d 2d 3b 0a 20 20 20 20 20 20 20 Delta--;.
4450: 20 74 6f 74 61 6c 20 2b 3d 20 63 6e 74 3b 0a 20 total += cnt;.
4460: 20 20 20 20 20 20 20 69 66 28 20 74 6f 74 61 6c if( total
4470: 3e 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20 20 >limit ){.
4480: 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 20 69 /* ERROR: i
4490: 6e 73 65 72 74 20 63 6f 6d 6d 61 6e 64 20 67 69 nsert command gi
44a0: 76 65 73 20 61 6e 20 6f 75 74 70 75 74 20 6c 61 ves an output la
44b0: 72 67 65 72 20 74 68 61 6e 20 70 72 65 64 69 63 rger than predic
44c0: 74 65 64 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 ted */.
44d0: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 return -1;.
44e0: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 44 45 }. DE
44f0: 42 55 47 31 28 20 70 72 69 6e 74 66 28 22 49 4e BUG1( printf("IN
4500: 53 45 52 54 20 25 64 5c 6e 22 2c 20 63 6e 74 29 SERT %d\n", cnt)
4510: 3b 20 29 0a 20 20 20 20 20 20 20 20 69 66 28 20 ; ). if(
4520: 63 6e 74 3e 6c 65 6e 44 65 6c 74 61 20 29 7b 0a cnt>lenDelta ){.
4530: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 /* ERR
4540: 4f 52 3a 20 69 6e 73 65 72 74 20 63 6f 75 6e 74 OR: insert count
4550: 20 65 78 63 65 65 64 73 20 73 69 7a 65 20 6f 66 exceeds size of
4560: 20 64 65 6c 74 61 20 2a 2f 0a 20 20 20 20 20 20 delta */.
4570: 20 20 20 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 return -1;.
4580: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 }.
4590: 20 6d 65 6d 63 70 79 28 7a 4f 75 74 2c 20 7a 44 memcpy(zOut, zD
45a0: 65 6c 74 61 2c 20 63 6e 74 29 3b 0a 20 20 20 20 elta, cnt);.
45b0: 20 20 20 20 7a 4f 75 74 20 2b 3d 20 63 6e 74 3b zOut += cnt;
45c0: 0a 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 20 . zDelta
45d0: 2b 3d 20 63 6e 74 3b 0a 20 20 20 20 20 20 20 20 += cnt;.
45e0: 6c 65 6e 44 65 6c 74 61 20 2d 3d 20 63 6e 74 3b lenDelta -= cnt;
45f0: 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a . break;.
4600: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63 61 }. ca
4610: 73 65 20 27 3b 27 3a 20 7b 0a 20 20 20 20 20 20 se ';': {.
4620: 20 20 7a 44 65 6c 74 61 2b 2b 3b 20 6c 65 6e 44 zDelta++; lenD
4630: 65 6c 74 61 2d 2d 3b 0a 20 20 20 20 20 20 20 20 elta--;.
4640: 7a 4f 75 74 5b 30 5d 20 3d 20 30 3b 0a 20 20 20 zOut[0] = 0;.
4650: 20 20 20 20 20 69 66 28 20 63 6e 74 21 3d 63 68 if( cnt!=ch
4660: 65 63 6b 73 75 6d 28 7a 4f 72 69 67 4f 75 74 2c ecksum(zOrigOut,
4670: 20 74 6f 74 61 6c 29 20 29 7b 0a 20 20 20 20 20 total) ){.
4680: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 20 /* ERROR:
4690: 62 61 64 20 63 68 65 63 6b 73 75 6d 20 2a 2f 0a bad checksum */.
46a0: 20 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e return
46b0: 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 -1;. }.
46c0: 20 20 20 20 20 20 20 69 66 28 20 74 6f 74 61 6c if( total
46d0: 21 3d 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20 !=limit ){.
46e0: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 67 /* ERROR: g
46f0: 65 6e 65 72 61 74 65 64 20 73 69 7a 65 20 64 6f enerated size do
4700: 65 73 20 6e 6f 74 20 6d 61 74 63 68 20 70 72 65 es not match pre
4710: 64 69 63 74 65 64 20 73 69 7a 65 20 2a 2f 0a 20 dicted size */.
4720: 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e 20 return
4730: 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 -1;. }.
4740: 20 20 20 20 20 20 72 65 74 75 72 6e 20 74 6f 74 return tot
4750: 61 6c 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 al;. }.
4760: 20 20 64 65 66 61 75 6c 74 3a 20 7b 0a 20 20 20 default: {.
4770: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 75 /* ERROR: u
4780: 6e 6b 6e 6f 77 6e 20 64 65 6c 74 61 20 6f 70 65 nknown delta ope
4790: 72 61 74 6f 72 20 2a 2f 0a 20 20 20 20 20 20 20 rator */.
47a0: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 return -1;.
47b0: 20 20 7d 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20 }. }. }.
47c0: 2f 2a 20 45 52 52 4f 52 3a 20 75 6e 74 65 72 6d /* ERROR: unterm
47d0: 69 6e 61 74 65 64 20 64 65 6c 74 61 20 2a 2f 0a inated delta */.
47e0: 20 20 72 65 74 75 72 6e 20 2d 31 3b 0a 7d 0a return -1;.}.